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Vorrichtung und Verfahren zum skalierbaren Codieren und 
Vorrichtung und Verfahren zum skalierbare Decodieren 



Beschreibung 



Die vorliegende Erfindung bezieht sich auf Audio- und/oder 
Videocodierer/Decodierer und insbesondere auf Codierer- 
/Decodierereinrichtungen, die eine Skalierbarkeit aufwei- 



sen. 



Moderne Audiocodierverf ahren, wie z. B. MPEG LayerS (MP3) 
Oder MPEG AAC verwenden Transf ormtionen wie beispielsweis e 
die sogenannte nodifizierte diskrete Cosinustransf oritation 
(MDCT), urn eine blockweise Frequen zdarstellung eines Audio - 
signals zu erhalten. Ein solcher Audiocodierer erhalt iibli- 
cherweise einen Strom von zeitdiskret en Audio -Abtastwerten. 
Der Strom von Audio -Abtastwerten wird gefenstert, um einen 
gefensterten Block von beispielsweise 1024 oder 2048 gefen- 
sterten Audio -Abtastwerten zu erhalten. Zur Fensterung wer- 
den verschiedene Fensterf unktionen eingesetzt, wie z. B. 
ein Sinus -Fenster, etc. 

Die gefensterten zeitdiskreten Audio -Abtastwerte werden 
dann mittels einer Filterbank in eine spektrale Darstellung 
umgesetzt. Prinzipiell kann hierzu eine Fourier- 
Transformation, Oder aus speziellen Griinden eine Abart der 
Fourier -Transformation, wie z. B. eine FFT oder, wie es 
ausgefiihrt worden ist, eine MDCT eingesetzt werden. Der 
Block von Audio -Spektralwert en am Ausgang der Filterbank 
kann dann je nach Bedarf weiter verarbeitet werden. Bei den 
oben bezeichneten Audio -Codierern folgt eine Quantisierung 
der Audio -Spektralwerte, wobei die Quant isierungsstuf en ty- 
pischerweise so gewahlt werden, dali das durch das Quanti- 
sieren eingefiihrt Quantisierungsrauschen unterhalb der psy- 
choakustischen Maskierungsschwell e liegt, d. h. "wegmas- 
kiert" wird. Die Quantisierung ist eine verlustbehaf tete 
Codierung. Um eine weitere Datenmengenreduktion zu erhal - 
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ten, werden die quantisierten Spektral werte anschlieftend 
beispielsweise mittels einer Huff man -Codierung Entropie- 
codiert. Durch Hinzufiigen von Seiteninf ormationen, wie z. 
B. Skalenfaktoren etc. wird aus den Entropie-codierten 
5 quantisierten Spektral werten mittels eines Bitstrom- 
Multiplexers ein Bitstrom gebildet, der gespeichert oder 
iibertragen werden kann. 

Im Audio -Decodierer wird der Bitstrom mittels eines 
10 Bitstrom-Demultiplexers in codierte quantisierte Spektral - 
werte und Seiteninf ormationen aufgeteilt. Die Entropie- 
codierten quantisierten Spektral werte werden zunachst 
Entropie-decodiert, um die quantisierten Spektral werte zu 
erhalten. Die quantisierten Spektral werte werden dann in- 
15 vers quantisiert, um decodierte Spektral werte zu erhalten, 
die Quantisierungsrauschen aufweisen, das jedoch unterhalb 
der psychoakustischen Maskierungsschwell e liegt und daher 
unhorbar sein wird. Diese Spektral werte werden dann mittels 
eines Synthese -Filter bank in eine zeitliche Darstellung um- 
20 gesetzt, um zeitdiskrete decodierte Audio -Abtastwerte zu 
erhalten. In der Synthese-Filterbank mul5 ein zum Transfor- 
mations -Al go rithmus inverser Transformations -Algorithmus 
eingesetzt werden. Aulierdem mul5 nach der Frequenz-Zeit - 
Rue ktrans format ion das Fenstern riickgangig gemacht werden. 

25 

Um eine gute Frequen zsel ektivitat zu erreichen, verwenden 
moderne Audio -Co dierer t ypischerweise eine Block- 
Bberlappung. Ein solcher Fall ist in Fig. 10a dargestellt. 
Zunachst werden beispielsweise 2048 zeitdiskrete Audio - 

30 Abtastwerte genommen und mittels einer Einrichtung 402 ge- 
fenstert. Das Fenster, das die Einrichtung 402 verkorpert, 
hat eine Fensterlange von 2N Abtastwerten und liefert aus - 
gangsseitig einen Block von 2N gefensterten Abtastwerten. 
Um eine Fensteruberlappung zu erreichen, wird mittels einer 

35 Einrichtung 404, die lediglich aus Sbersichtlichkeitsgrun- 
den in Fig. 10a getrennt von der Einrichtung 402 darge- 
stellt ist, ein zweiter Block von 2N gefensterten Ab- 
tastwerten gebildet. Die in die Einrichtung 404 eingespei- 



- 3 - 



sten 2048 Abtastwerte sind jedoch nicht die an das erste 
Fenster unmittelbar anschl ielienden zeitdiskreten Audio - 
Abtastwerte, sondern beinhalten die zweite Halfte der durch 
die Einrichtung 402 gefensterten Abtastwerte und beinhalten 
5 zusatzlich lediglich 1024 "neue" Abtastwerte. Die Sberlap- 
pung ist durch eine Einrichtung 406 in Fig. 10a symbolisch 
dargestellt, die einen Sberlappungsgrad von 50% bewirkt. 
Sowohl die durch die Einrichtung 402 ausgegebenen 2N gefen- 
sterten Abtastwerte als auch die durch die Einrichtung 404 

10 ausgegebenen 2N gefensterten Abtastwerte werden dann mit - 
tels einer Einrichtung 408 bzw. 410 dem MDCT -Algorithraus 
unterzogen. Die Einrichtung 408 liefert gemali dem bekannten 
MDCT-Algorithmus N Spektralwerte fiir das erste Fenster, 
wahrend die Einrichtung 410 ebenfalls N Spektralwerte lie- 

15 fert, jedoch fiir das zweite Fenster, wobei zwischen dem er- 
sten Fenster und dem zweiten Fenster eine Sberlappung von 
50% besteht. 

Im Decodierer werden die N Spektralwerte des ersten Fen- 
20 sters, wie es in Fig. 10b gezeigt ist, einer Einrichtung 
412, die eine inverse modifizierte diskrete Cosinustrans - 
formation durchfiihrt, zugefiihrt. Dasselbe gilt fiir die N 
Spektralwerte des zweiten Fensters. Diese werden einer Ein- 
richtung 414 zugefiihrt, die ebenfalls eine inverse modifi- 
25 • zierte diskrete Cosinust ransf oritation durchfiihrt. Sowohl 
die Einrichtung 412 als auch die Einrichtung 414 liefern 
jeweils 2N Abtastwerte fiir das erste Fenster bzw. 2N Ab- 
tastwerte fiir das zweite Fenster. 

30 In einer Einrichtung 416, die in Fig. 10b mit TDAC ( TDAC = 
Time Domain Aliasing Cancellation) bezeichnet ist, wird die 
Tatsache beriicksichtigt, daB die beiden Fenster iiberlappend 
sind. Insbesondere wird ein Abtastwert yi der zweiten Half- 
te des ersten Fensters, also mit einem Index N+k, mit einem 

35 Abtastwert yz aus der ersten Halfte des zweiten Fensters, 
also mit einem Index k summiert, so dafi sich ausgangssei- 
tig, also im Decodierer, N decodierte zeitliche Abtastwerte 
ergeben. 



1 
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Es sei darauf hingewiesen, daft durch die Funktion der Ein- 
richtung 416, die auch als Add-Funktion bezeichnet wird, 
die in dem durch Fig. 10a schematisch dargestell ten Codie- 
5 rer durchgef iihrte Fensterung gewissermaI5en automatisch be- 
rucksichtigt wird, so daI3 in dem durch Fig. 10b dargestell - 
ten Decodierer keine explizite "inverse Fensterung" statt- 
zufinden hat. 

10 Wenn die durch die Einrichtung 402 oder 404 impl ementierte 
Fensterfunktion mit w( k) bezeichnet wird, wobei der Index k 
den Zeitindex darstellt, bezeichnet wird, so mulJ die Bedin- 
gung erfiillt sein, daB das Fenstergewicht w( k) im Quadrat 
^ addiert zu dem Fenstergewicht w( N+k) im Quadrat zusammen 1 

15 ergibt, wobei k von 0 bis N-1 lauft. Wenn ein Sinus -Fenster 
verwendet wird, dessen Fenster ^ewichtungen der ersten 
Halbwelle der Sinus -Funktion folgen^ so ist diese Bedingung 
immer erfullt, da das Quadrat des Sinus und das Quadrat des 
Cosinus fiir jeden Winkel zusammen den Wert 1 ergeben. 

20 

Nachteilig an dem in Fig. 10a beschriebenen Fenster- 
Verfahren mit anschl ieB ender MDCT -Funktion ist die Tatsa - 
Che, dali die Fensterung durch Mul tipl ikation eines zeitdis - 
kreten Abtastwerts, wenn an ein Sinus -Fenster gedacht wird, 
25 mit einer Gl eit komma zahl erreicht wird, da der Sinus eines 
Winkels zwischen 0 und 180 Grad abgesehen von dem Winkel 90 
Grad keine Ganzzahl ergibt. Auch wenn ganzzahlige zeitdis - 
krete Abtastwerte gefenstert werden, entstehen nach dem 
Fenstern also Gl eit komma zahl en. 

30 

Daher ist, auch wenn kein psychoakustischer Codierer ver- 
wendet wird, d. h. wenn eine verlustlose Codierung erreicht 
werden soil, am Ausgang der Einrichtungen 408 bzw. 410 eine 
Quantisierung notwendig, um eine einigermalien uberschaubare 
35 Entro pie -Codierung durchfiihren zu konnen. 



Wenn also bekannte Transf ormationen, wie sie anhand von 
Fig. 10a betrieben worden sind^ fiir ein verlustloses Audio- 
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codieren eingesetzt werden soli, muB entweder eine sehr 
feine Quantisierung eingesetzt werden, um den resultieren- 
den Fehler aufgrund der Rundung der Gl eitkoimna zahl en ver- 
nachlassigen zu konnen, oder das Fehlersignal mufi zusatz- 
5 lich beispielsweise im Zeitbereich codiert werden. 

Konzepte der ersteren Art, also bei denen die Quantisierung 
so fein eingestellt, dal5 der resul tierende Fehler aufgrund 
der Rundung der Gl eitkomma zahl en vernachlassigbar ist, sind 
10 beispielsweise in der deutschen Patentschrif t DE 197 42 201 
CI offenbart. Hier wird ein Audiosignal in seine spektrale 
Darstellung iiberfiihrt und quantisiert, um quantisierte 
Spektralwerte zu erhalten. Die quantisierten Spektralwerte 
werden wieder invers quantisiert, in den Zeitbereich iiber- 
15 fuhrt und mit dem urspriingl ichen Audiosignal verglichen. 
Liegt der Fehler, also der Fehler zwischen dem urspriingl i- 
chen Audiosignal und dem quantisiert en/ invers quantisierten 
Audiosignal, oberhalb einer Fehlerschwelle, so wird der 
Quantisierer ruckkopplungsmalJig feiner eingestellt, und der 
20 Vergleich wird erneut durchgef iihrt. Die Iteration ist been- 
det, wenn die Fehlerschwelle unterschritten wird. Das dann 
noch moglicherweise vorhandene Restsignal wird mit einem 
Zeitbereichscodierer codiert und in einen Bitstrom ge- 
schrieben, der neben dem Zeitbereichs ^odierten Restsignal 
25 auch codierte Spektralwerte umfalit, die gemaB den Quanti- 
sierereinstellungen quantisiert worden sind, die zum Zeit - 
punkt des Abbruchs der Iteration vorhanden waren. Es sei 
darauf hingewiesen, dal5 der verwendete Quantisierer nicht 
von einem psychoakustischen Modell gesteuert werden muli, so 
30 dali die codierten Spektralwerte t ypischerweise genauer 
quantisiert sind, als dies aufgrund des psychoakustischen 
Modell s sein miilite. 

In der Fachverof f entl ichung „A Design of Lossy and Lossless 
35 Scalable Audio Coding", T. Moriya u.a., Proc. ICASSP, 2000, 
ist ein skalierbarer Codierer beschrieben, der als erstes 
verlustbehaftetes Datenkompressionsmodul z. B. einen MPEG- 
Codierer umfalit, der eine blockweise digital e Signalform 



J 
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als Eingangssignal hat und den komprimierten Bitstrom er- 
zeugt. in einem ebenfalls vorhandenen lokalen Decodierer 
wird die Codierung wieder riickgangig geitiacht, und es wird 
ein codiertes/decodiertes Signal erzeugt. Dieses Signal 
5 wird mit dem ursprungl ichen Eingangssignal verglichen, in- 
dem das codiert e/decodierte Signal von dem ursprungl ichen 
Eingangssignal subtrahiert wird. Das Fehlersignal wird dann 
in ein zweites Modul eingespeist, wo eine verlustlose Bit - 
konversion verwendet wird. Diese Konversion hat zwei 
10 Schritte. Der erste Schritt besteht in einer Konversion von 
einem Zweierkomplement format in ein Vor zeichen -Betrag - 
Format. Der zweite Schritt besteht in der Umwandlung von 
einer vertikalen Betragssequenz in eine horizontale Bitse- 
quenz in einem Vera rbeitungs block. Die verlustlose Datenum- 
15 wandlung wird ausgefuhrt, urn die Anzahl von Nullen zu maxi- 
mieren oder die Anzahl von auf einanderf olgenden Nullen m 
einer Sequenz zu maximieren, urn eine moglichst gute Kompri - 
mierung des zeitlichen Fehlersignals, das als Folge von di- 
gital en aihlen vorliegt, zu erreichen. Dieses Prinzip ba - 
20 siert auf einem Bit -SI ice -Arithmetic -Coding - (BSAC-) Sche- 
ire, das in der Fachverof f entlichung „Multi -Layer Bit Sliced 
Bit Rate Scalable Audio Coder", 103. AES -Convention, Pre- 
print Nr. 4520, 1997, dargestellt ist. 

25 Die oben bezeichnete BS AC -Veroff entlichung offenbart in et- 
wa einen Codierer, wie er in Fig. 8 dargestellt ist. Ein 
Zeitsignal wird in einen Block 80 eingespeist, der mit 
Fenstern" und Zeit -/Frequenzumset zung bezeichnet ist. Ty- 
pischerweise wird im Block 80 eine MDCT (MDCT = modifizier- 

30 te diskrete Kosinustransf ormation) verwendet. Hierauf wer- 
den die von dem Block 80 erzeugten MDCT -Spekt ral werte in 
einem Block 82 quantisiert, um quantisierte Spektral werte 
in binarer Form zu erhalten. Die Quantisierung durch den 
Block 82 wird durch eine Einrichtung 84 gesteuert, die un- 

35 ter Verwendung eines psychoakustischen Modells eine Maskie- 
rungsschwelle berechnet, wobei die Quantisierung in dem 
Block 82 derart durchgefiihrt wird, daii das Quantisierungs - 
rauschen unterhalb der psychoakustischen Maskierungsschwel - 



le bleibt. In einem Block 85 werden die quantisierten Spek- 
tralwerte dann bitweise angeordnet, derart, daJi die Bits 
gleicher Ordnung der quantisierten Spektral werte in einer 
Spalte sind. In einem Block 86 werden dann Skalierungs- 
5 schichten gebildet, wobei eine Skal ierungsschicht einer 
Spalte entspricht. Eine Skal ierungsschicht umfalbt daher die 
Bits gleicher Ordnung samtlicher quantisierten Spektralwer- 
te. Daran anschl ieliend wird jede Skal ierungsschicht nach- 
einander einer arithmetischen Codierung unterzogen (Block 
0 87), wobei die von dem Block 87 ausgegebenen Skalierungs- 
schichten in ihrer redundant codierten Form einer Bitstrom- 
bildungseinrichtung 88 zugefuhrt werden, welche ausgangs- 
seitig das skalierte/codierte Signal liefert, das neben den 
einzelnen Skalierungsschichten auch noch Seiteninf ormatio - 
5 nen umfassen wird, wie es bekannt ist. 

Allgemein gesagt wird der bekannte skalierbare BSAC- 
Codierer die Bits hochster Ordnung aller nach psychoakusti - 
schen Gesichtspunkten quantisierten Spektralwerten nehmen, 
einer arithmetischen Codierung unterziehen und dann als er- 
ste Skal ierungsschicht in den Bitstrom schreiben. Da typi- 
scherweise sehr wenige sehr grofie Spektral werte vorhanden 
sein werden, haben auch sehr wenige quantisierte Spektral - 
werte ein Bit hochster Ordnung gleich „1'\ 



JO 



25 



aur Erzeugung der zweiten Skal ierungsschicht werden nunmehr 
die Bits zweithochster Ordnung aller Spektral werte genom- 
men, einer arithmetischen Codierung unterzogen und dann in 
den Bitstrom als zweite Skal ierungsschicht geschrieben. 
30 Diese Prozedere wird solange wiederholt, bis die Bits der 
geringsten Ordnung aller quantisierten Spektral werte arith- 
metisch codiert und als letzte Skal ierungsschicht in den 
Bitstrom geschrieben worden sind. 

35 Fig. 9 zeigt einen skalierbaren Decodierer zum Decodieren 
von durch den in Fig. 8 gezeigten skalierbaren Codierer er- 
zeugten skalierten/codierten Signalen. Der skalierbare De- 
codierer umfaBt zunachst eine Bitstromdeformatierungsein - 
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richtung 90, eine Skalierungsschichtextraktionseinrich- 
tung/Decodierungseinrichtung 91, eine inverse Quantisie- 
rungseinrichtung 92 sowie schlieiilich eine Frequenzbereich- 
/ Zeitbereichumsetzungseinrichtung 93, urn ein decodiertes 
5 Signal zu erhalten, dessen Qualitat proportional zu der An- 
zahl der von der Einrichtung 91 ausgewahlten Anzahl von 
Skalierungsschichten abhangt. 

Im einzelnen wird die Bitstromdef ormatierungseinrichtung 

10 den Bitstrom aufpacken und neben den Seiteninforniationen 
die verschiedenen Skalierungsschichten bereitstell en. Die 
Einrichtung 91 wird dann zunachst die erste Skalierungs- 
schicht arithmetisch decodieren und abspeichern. Dann wird 
die zweite Skalierungsschicht arithmetisch decodiert und 

15 abgespeichert. Dieses Prozedere wird solange wiederholt, 
bis entweder alle im skalierten/codierten Signal enthalte- 
nen Skalierungsschichten arithmetisch decodiert und abge- 
speichert worden sind, bzw. wird solange wiederholt, bis 
die iiber einen Steuereingang 94 geforderte Anzahl von Ska- 

20 lierungsschichten decodiert und abgespeichert worden sind. 
Damit werden sukzessive die Binarmuster fiir j ede einzelne 
quantisierte Spektrallinie erzeugt, wobei diese in Binar- 
form dargestellten quantisierten Spektral wert e unter Be- 
riicksichtigung eines Skal enf aktors etc. der inversen Quan- 

25 tisierung 92 unterzogen werden konnen, urn dann invers quan- 
tisierte Spektralwerte zu erhalten, die durch die Einrich- 
tung 93 in den Zeitbereich umgesetzt werden miissen, urn das 
decodierte Signal zu erhalten. 

30 Bei der Decodierung wird somit mit jeder Skalierungsschicht 
ein Bit fiir jeden Spektral wert gewonnen. Die z. B. nach ei - 
ner Decodierung von fiinf Skalierungsschichten verfiigbaren 
Bits fur jede Spektrallinie sind die obersten fiinf Bits. Es 
sei darauf hingewiesen, dali bei sehr kl einen Spektral wer- 

35 ten, deren hoc hst wert iges Bit erst z. B. an fiinf ter St ell e 
kommt, durch die Decodierung von fiinf Skalierungsschichten 
erst das MSB (MSB = most significant bit) dieser Spektral- 
linie vorliegt, wobei zur genaueren Darstellung dieser 



Spektrallinie noch weitere Skalierungsschichten verarbeit 
werden mussen. 



Die binare Darstellung von Spektral werten bringt es mit 
sich, dali - die MDCT -Spektral werte beispielsweise sind Am- 
plitudenwerte - jedes zusatzliche Bit einen Genauigkeitsge - 
Winn fiir die Spektrallinie von 6 dB bedeutet. 

Durch jede zusatzliche Skal ierungsschicht ergibt sich somit 
eine Erhohung der Genauigkeit aller Spektral werte urn 6 dB. 

Beachtet man nun, dalJ zumindest bei rauschartigen Signal en 
die Mithorschwelle nur etwa 6 dB unterhalb des Signals 
liegt, so ergibt sich, dali eine bitweise Skalierung, wie 
sie durch das bekannte Codier -/Decodierkonzept geliefert 
wird, insbesondere fiir eine effiziente Codierung der gerade 
noch hdrbaren Signalanteil e, also beispielsweise fiir die 
unteren Bits der nach psychoakustischen Gesichtspunkten 
quantisierten Spektral werte in der Genauigkeit problema- 
tisch ist. 

Wird beispielsweise aufgrund eines Sbert ragungskanal engpas - 
ses die unterste Skal ierungsschicht des durch den Block 88 
von Fig. 8 ausgegebenen skal ierten/codierten Signals nicht 
iibertragen, so wird dies Genauigkeitsverluste von 6 dB zur 
Folge haben, was bei ungiinstiger Konstellation zu deutlich 
horbaren Storungen im decodierten Signal fiihren wird. 

Die Aufgabe der vorliegenden Erfindung besteht darin, ein 
Konzept zum skalierbaren Codieren/Decodieren zu schaffen, 
durch das eine feinere Skalierbarkeit erreichbar ist. 

Diese Aufgabe wird durch eine Vorrichtung zum skalierbaren 
Codieren gemali Patentanspruch 1, ein Verfahren zum skalier- 
baren Decodieren gemali Patentanspruch 17, durch ein Verfah- 
ren zum skalierbaren Codieren gemali Patentanspruch 19, ein 
Verfahren zum skalierbaren Decodieren gemaJi Patentanspruch 



20 Oder durch ein Computerprogramm gemafi Patentanspruch 21 
gelost. 

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, 
dali die psychoakustischen Verdeckungsef f ekte im Frequenzbe- 
reich bandweise und nicht linienweise auftreten, so daI5 
durch eine Erhohung der Genauigkeit einer Spektrallinie in 
einem Band derselbe Genauigkeitsgewinn pro Band erreicht 
wird, als wenn eine gl eichmaBige bruchteilige Erhohung der 
Genauigkeit im ganzen Band durchgefiihrt werden wiirde, was 
jedoch bei einer bitweisen Einteilung der Skalierungs- 
schicht nicht moglich ist. Erf indungsgemali wird die Verfei- 
nerung der Genauigkeitsskal ierung dadurch erreicht, daJi die 
Bitschichten in Teilskal ierungsschichten unterteilt werden. 
Im Gegensatz zum Stand der Technik, bei dem die Bits einer 
bestimmten Ordnung aller quantisierten Spektral werte zu ei- 
ner Skalierungsschicht zusammengef afit wurden, werden erf in- 
dungsgemali in einer ersten Teilskal ierungsschicht die Bits 
dieser Ordnung von nur einem Teil der quantisierten Spek- 
tral werte in dem betrachteten Band als Teilskal ierungs - 
schicht verwendet. Die nachste Teil skalierungsschicht er- 
halt dann die Bits derselben Ordnung, nun jedoch von ande- 
ren quantisierten Spektral wert en als in der erste Teilska- 
1 ierungsschicht, um die zweite Teilskal ierungsschicht zu 
erhalten. 

Wenn beispielsweise ein Band mit m = 4 quantisierten Spek- 
tralwerten betrachtet wird, so wurde im Stand der Technik 
eine bestimmte Skalierungsschicht die Bits bestimmter Ord- 
nung aller vier Spektrallinien in dem betrachteten Band um- 
fassen. Die nachste Skalierungsschicht wiirde dann wieder 
samtlich Bits der bestimmten Ordnung weniger 1 aller quan- 
tisierten Spektrallinien umfassen, so dafi sich von Skalie- 
rungsschicht zu Skalierungsschicht ein Genauigkeitsgewinn 
pro Spektrallinie von 6 dB ergibt. 

Erf indungsgemali wird die bestimmte Skalierungsschicht nun- 
mehr in maximal m Teilskal ierungsschichten aufgeteilt. Die 



erste Teilskalierungsschicht wiirde dann lediglich das Bit 
bestiiranter Ordnung der ersten Spektrall inie umfassen und 
keine Bits der zweiten, dritten und vierten Spektrall inie. 
Die zweite Teilskalierungsschicht wurde dann das Bit be- 
stimmter Ordnung der zweiten quantisiert en Spektrall inie 
umfassen, jedoch kein Bit fiir die erste, dritte und vierte 
Spektrallinie. Auf ahnliche Art und Weise wird die dritte 
Teilskalierungsschicht das Bit bestimmter Ordnung der drit- 
ten Spektrallinie umfassen, und wird die vierte Teilskalie- 
rungsschicht das Bit bestimmter Ordnung der vierten Spek- 
trallinie des betrachteten Bandes umfassen. Nachdem, wie es 
ausgefuhrt worden ist, Verdeckungsef f ekte bandweise und 
nicht linienweise auftreten, liefert jede zusatzliche 
Teilskalierungsschicht einen Genauigkeitsgewinn von 6/m dB. 
Dies bedeutet, daJi bei dem betrachteten Beispiel m = 4 jede 
Teilskalierungsschicht einen Genauigkeitsgewinn von 1,5 dB 
bringt. 

Es sei darauf hingewiesen, daB in einer Teilskalierungs- 
schicht auch die Bits der bestimmten Ordnung von mehr als 
einer quantisierten Spektrallinie vorhanden sein konnen. 
Wiirde bei dem betrachteten Beispiel eine Teilskalierungs- 
schicht die Bits bestimmter Ordnung von zwei quantisierten 
Spektrall inien umfassen, so ware der Genauigkeitsgewinn pro 
Teilskalierungsschicht nicht mehr 1, 5 dB, sondern 3, 0 dB. 
Allgemein gesagt wird die zweite Anzahl der quantisierten 
Spektralwerte, von denen Bits in der zweiten Teilskalie- 
rungsschicht vorhanden sind, so gewahlt, daii sie groBer 
Oder gleich 1 und kleiner als die Gesamtanzahl der quanti- 
sierten Spektralwerte in dem Band ist, wobei die zweite An- 
zahl von Spektralwerten ferner zumindest das Bit bestimmter 
Ordnung eines quantisierten Spektral werts aufweist, der in 
der ersten Anzahl von quantisierten binaren Spektralwerten, 
deren Bits in der ersten Teilskalierungsschicht vorhanden 
sind, nicht vorhanden ist. 

Erfindungsgemali existieren verschiedene MSglichkeiten zur 
Auswahl, welcher Spektralwert fiir die nachste Teilskalie- 
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rungsschicht auszuwahlen ist. 1st die Mithorschwell e bei - 
spielsweise linienweise ( z. B. genauer als in 6-dB- 
Schritten) dargestellt, so laJ3t sich im Codierer genau er- 
mitteln, welche der m Spektrallinien bisher am ungenauesten 
5 ist. 

Ist die Mithorschwell e dagegen bandweise ( z. B. in 6-dB- 
Schritten) dargestellt, so ist am Beginn der Codierung ei- 
ner neuen Schicht, also beim Erzeugen einer Teilskalie- 

10 rungsschicht fiir eine neue Bitschicht, jede Spektrall inie 
mit derselben Genauigkeit relativ zur Mithorschwell e iiber - 
tragen. In der Auswahl der Linienreihenf olge in den Teil - 
schichten lassen sich allerdings die Werte der bis dahin 
ubertragenen Spektrallinien beriicksichtigen. Codiert roan in 

15 den folgenden Teil schichten beispielsweise zuerst die Spek- 
trallinien mit kleinen Spektralwerten, so ergibt sich eine 
genauere spektrale Formung des resultierenden Quantisie- 
rungsf ehlers. 

20 Bei einem bevorzugten Ausf iihrungsbeispiel der vorliegenden 
Erfindung werden T eil skalierungs schicht en unter Verwendung 
von psychoakustisch quantisierten Spektralwerten gebildet, 
wobei die bestimmte Ordnung der Bits, die in den Teilska- 
lierungsschichten verarbeitet werden, uber dem betrachteten 
25 Band, das m Spektrallinien aufweist, konstant ist. Im Falle 
von psychoakustisch quantisierten binaren Spektralwerten 
miissen fiir eine psychoakustisch transparente Codierung 
samtliche Bits der quantisierten Spektral werte iibertragen 
werden. In diesem Fall ist insbesondere bei den niederwer- 
30 tigen Bits der binaren quantisierten Spektral werte eine 
feinere Skalierbarkeit von Vorteil, um eine Decodierung mit 
langsam abnehmender Qualitat je nach Anzahl der berucksich- 
tigten Teilskalierungsschichten zu ermoglichen. 

35 Bei einem alternativen Ausf iihrungsbeispiel der vorliegenden 
Erfindung sind die quantisierten Spektralwerte nicht unter 
Berucksichtigung psychoakustischer Gesichtspunkte quanti- 
siert, sondern liegen im Rahmen der Rechengenauigkeit eines 
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Rechners vor der Quantisierung vor. Alternativ sind die 
quantisierten Spektralwerte unter Verwendung einer Integer - 
MDCT erzeugt worden, die in „Audio Coding Based on Integer 
Transforms", 111. AES -Versammlung, New York, 2001, Geiger, 
5 Herre, Roller, Brandenburg, beschrieben ist. 

Die IntMDCT ist besonders gunstig, da sie die attraktiven 
Eigenschaften der MDCT hat, wie beispielsweise eine gute 
spektrale Darstellung des Audiosignals, eine kritische Ab- 
10 tastung und ein Blockiiberlappung. Wie es ausgefuhrt wird, 
ist die IntMDCT eine verlustlose Transformation, d. h. Run- 
dungen auf Integer-Werte wahrend der Vorwartstransf ormation 
konnen durch eine inverse Rundungsoperation bei der Riick- 
wartstransf ormation berucksichtigt werden, so dali keinerlei 
15 Rundungsf ehler auftreten. 

IntMDCT -Spektralwerte liegen daher verlustlos vor, d. h. 
sie wurden nicht unter Berucksichtigung psychoakustischer 
Gesichtspunkte quantisiert. 

20 

Fur eine Skalierung hinsichtlich der psychoakustischen Mas - 
kierungsschwelle wird es bevorzugt, zumindest das hochst - 
wertige Bit der psychoakustischen Maskierungsschwell e fiir 
jeden Spektralwert bzw. fiir jedes Band zu bestimmen und die 

25 bestimmte Ordnung der Bits, die in eine Skal ierungsschicht 
kommen sollen bzw. in eine Teilskal ierungsschicht kommen 
^ sollen, nicht mehr absolut - wie bei den ps ychoakustisch 

quantisierten Spektral werten - festzulegen, sondern relativ 
zum entsprechenden hochstwertigen Bit der psychoakustischen 

30 Maskierungsschwell e. Die bestimmte Ordnung fiir die Bits in 
einer Skal ierungsschicht ist daher relativ zur psychoaku- 
stischen Maskierungsschwelle definiert, beispielsweise da - 
durch, dali in einer Skal ierungsschicht die Bits der Spek- 
tralwerte codiert werden sollen, die z. B. eine um 1 hohere 

35 Ordnung haben als das MSB der psychoakustischen Maskie- 
rungsschwelle fiir den entsprechenden Spektralwert bzw. - 
bei einer bandweisen Bereitstellung der psychoakustischen 
Maskierungsschwelle - fiir das Band, in dem der Spektralwert 
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liegt. Die bestimmte Ordnung zur Definition der Skalie- 
rungsschichten im Falle von Spektral werten, die nicht unter 
Beriicksichtigung ps ychoakustischer Gesetze quantisiert 
sind, ist somit eine relative Ordnung bezogen auf das MSB 
5 der psychoakustischen Maskierungsschwelle, das fur den be- 
treffenden Spektralwert einschlagig ist. 

Gemali der vorliegenden Erfindung wird es bevorzugt, fur ei- 
ne psychoakustisch transparente Codierung/Decodierung samt- 

10 liche Bits der quantisierten Spektral werte in einzelnen 
Skalierungsschichten oder Teilskalierungsschichten zu iiber- 
tragen, die die gleiche Ordnung wie das MSB der psychoaku- 
stischen Maskierungsschwelle haben oder deren Ordnung hoher 
als die Ordnung des MSB der psychoakustischen Maskierungs- 

15 schwelle ist. 

Insbesondere bei der Definition der Skal ierungsschicht, die 
die Bits der quantisierten Spektral werte umfassen soil, die 
die gleiche Ordnung haben wie die hochstwertigen Bits der 

20 psychoakustischen Maskierungsschwelle, wird es bevorzugt, 
eine Einteilung in Teilskalierungsschichten durchzuf uhren, 
urn gewissermaBen an der Grenze der Horbarkeit von Storungen 
eine bessere Genauigkeitsskalierung zu erreichen. Wird z. 
B. der gesamte Frequenzbereich oder ein Teil des Frequenz- 

25 bereichs in Bander von z. B. je vier Spektral werten aufge- 
teilt und wird in einer Teilskal ierungsschicht immer ein 
Spektralwert aller resul tierenden Bander iibertragen, so 
kann mit jeder Teilskalierungsschicht eine Genauigkeits zu - 
nahme von 1,5 dB erreicht werden. 

30 

Es sei darauf hingewiesen, dafi die Genauigkeitsskalierung 
beliebig wahlbar ist, indem die GroBe der Bander einge- 
stellt wird. Werden beispielsweise acht Spektral werte in 
ein Band gruppiert und enthalt jede Teilskalierungsschicht 
35 nur das Bit von einem Spektralwert aus diesem Band, so wird 
eine Genauigkeitsskalierung von 0,75 dB erreicht. 
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Ein Vorteil des erf indungsgemalien Konzepts der Unterteilung 
einer Skalierungsschicht in mehrere Teilskalierungsschich- 
ten, die jedoch unabhangig voneinander extrahierbar und de- 
codierbar sind, besteht darin, dafi. es mit samtlichen bests - 
5 henden weiteren Skal ierbarkeitsmogl ichkeiten kompatibel 
ist. Beispielhaft hierfiir sei die Bandbreit enskal ierung ge- 
nannt, bei der fiir die gehorangepaiite Codierung von Audio - 
signal en bei niedrigen Bit rat en meist eine Reduzierung der 
Audio bandbreite vorgenommen wird, um die verbleibenden 

10 Spektralwerte rait ausreichender Genauigkeit darstellen zu 
konnen. Diese z. B. Kanalabhangige Bandbreitenskal ierung 
lalJt sich auch im erf indungsgemaBen Kontext der Verwendung 
von Teilskalierungsschichten realisierten. Hierzu wird bei 
den ersten Schichten nur ein nach oben begrenzter Frequenz- 

15 bereich beriicksichtigt und mit zunehmender Genauigkeit in 
den weiteren Schichten bzw. Teil schichten werden schritt- 
weise weitere bisher nicht berucksichtigte hohere Frequenz- 
bereiche mitcodiert. 

20 Ein weiterer Vorteil des erf indungsgemaBen Konzepts der 
Teilskalierungsschichten besteht darin, daB es ebenfalls 
mit der kontexta bhang ig en arithmetischen Codierung kompati- 
bel ist, die auch bei MPEG -4 BSAC verwendet wird. MPEG- 
4 BSAC ist in „Coding of Audio -Visual Objects: Audio", In- 

25 ternational Standard 144 96-3, 2. Auflage, ISO/IEC Moving 
Pictures Expert Group, ISO/IEC JTC1/SC2 9/WGll, 2001, be- 
schrieben. 

Das erf indungsgemaBe Konzept ist ferner dahingehend vor- 
30 teil haft, daB decodiererseitig eine beliebige Interpretati- 
on der quantisierten Werte vorgenommen werden kann. Werden 
nicht alle Bitschichten des Spektrums iibertragen, so liegen 
im Decodierer fiir jeden Spektralwert nur die hoherwertigen 
Bits vor. AuBerdem laBt sich bei der bei einem bevorzugten 
35 Ausf iihrungsbeispiel der vorliegenden Erfindung mitubertra- 
genen Mithorschwelle und der Zahl der iibertragenen Bit- 
schichten ermitteln, wie viele Bits dieses Spektralwerts 
nicht iibertragen wurden. Aus diesen Daten muB der Decodie- 
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rer einen quantisierten Spektralwert rekonstruieren. Eine 
plausible Moglichkeit hierfiir ware, die nicht iibert ragenen 
Bits durch Null en zu ersetzen. Damit fiihrt der Quantisie- 
rungsprozeft durch Weglassen von Skal ierungsschichten immer 
5 zu einer Abrundung zu kleineren Absolutwerten. Diese Art 
der Quantisierung fiihrt jedoch nicht zum kl einstmogl ichen 
mittleren Quantisierungsf ehl er. Der mittlere Quantisie- 
rungsfehler lalbt sich bei dieser Art der Quantisierung re- 
duzieren, indem man alternative Decodiererrekonstruktions - 
10 strategien einsetzt, 

Bevorzugte Ausf iihrungsbeispiele der vorliegenden Erfindung 
werden nachfolgend Bezug nehmend auf die beiliegenden 
Zeichnungen naher erlautert. Es zeigen: 

15 

Fig. la ein Blockschaltbild eines erf indungsgemaBen Co - 
dierers; 

Fig. lb eine scheinatische Darstellung eines skalierten 
20 codierten Signals mit Skal ierungsschichten und 



Teil skal ierungsschichten; 



Fig. 



2 



eine Aufteilung eines Bet ragsspekt rums in Bit - 
schichten parallel zur Mithdrschwell e; 



25 



Fig. 



3 



eine schematische Darstellung der Aufteilung von 
Fig. 2 unter Beriicksichtigung des MSB der Maskie- 
rungsschwell e; 



30 Fig. 



4 



eine schematische Darstellung zur Veranschauli - 
Chung der Auswahl eines Spektral werts fiir die 
nachste Teilskal ierungsschicht bei kontinuierl ich 
gegebener Mithorschwell e; 



35 Fig. 



eine schematische Darstellung zur Veranschaul i - 
Chung der Auswahl eines Spektral werts fiir eine 
Teil skal ierungsschicht bei einer bandweisen Dar- 
stellung der Mithorschwell e; 



Fig. 6 ein detailliertes Blockschaltbild eines erfin- 
dungsgemalien Codierers; 

Fig. 7 ein Blockschaltbild eines erf indungsgemaBen Deco- 
dierers mit IntMDCT; 

Fig. 8 ein Blockschaltbild eines bekannten BSAC- 
Codierers; 



Fig. 



9 ein Blockschaltbild eines bekannten BSAC- 
Decodierers; 



Fig. 10a ein schematisches Blockschaltbild eines bekannten 
Codierers mit MDCT und 50 -Pro zent -8berlappung; 

Fig. 10b ein Blockschaltbild eines bekannten Decodierers 
zum Decodieren der durch Fig.. 10a erzeugten Wer- 
te; 

Fig. 11 ein Blockschaltbild einer bevorzugten Einrichtung 
zum Verarbeiten von zeitdiskret en Audioabtastwer - 
ten, um ganzzahlige Werte zu erhalten, aus denen 
ganzzahlige Spektral werte mittelbar sind; 

Fig. 12 eine schematische Darstellung der Zerlegung einer 
MDCT und einer inversen MDCT in Givens -Rotationen 
und zwei DCT -IV-Operationen; und 

Fig. 13 eine Darstellung zur Veranschaul ichung der Zerle- 
gung der MDCT mit 50 -Pro zent -Bberlappung in Rota- 
tionen und DCT -IV-Operationen. 

Fig. la zeigt ein schematisches Blockschaltbild einer Vor- 
richtung zum skalierbaren Codieren eines Spektrums eines 
Signals, das Audio - und/oder Videoinformationen umfaBt, wo - 
bei das Spektrum binare Spektral werte aufweist, die in Ban- 
dern gruppiert sind. Ein Band von binaren Spektralwerten 
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des Audio- und/oder Videosignals wird in einen Eingang 100 
der Vorrichtung zum skalierbaren Codieren von Fig. la exn- 
gespeist. Die Gruppierung von binaren Spekt ral werten in 
Bander kann beliebig erfolgen. Wie es ausgefiihrt worden 
5 ist, basiert die vorliegende Erfindung darauf, daB Verdek- 
kungseffekte im Frequenzbereich bandweise und nicht spe- 
tralwertweise auftreten. Aus diesem Grund wird es bevor- 
zugt, die Gruppierung der binaren Spektralwerte in Bander 
unter Verwendung z. B. der Frequenzgruppen (critical bands) 
10 durchzufiihren, oder unter Verwendung von Bandern, die klei- 
ner sind als die Frequenzgruppen, d. h. die weniger Spek- 
tralwerte umfassen, als eine Frequenzgruppe umfalit, so daB 
eine psychoakustische oder psychooptische Frequenzgruppe in 
z. B. zwei Oder mehr Bandern gruppiert wird. 

Ein Band von binaren Spektral werten des Audio- und/oder Vi- 
deosignals wird in eine Einrichtung 102 zum Erzeugen der 
Teilskalierungsschichten eingespeist, wobei die Einrichtung 
102 zum Erzeugen der Teilskalierungsschichten eine erste 
20 Teilskalierungsschicht, eine zweite Teilskalierungsschicht 
und gegebenenfalls weitere Teilskalierungsschichten er- 
zeugt. Die Teilskalierungsschichten werden an Ausgangslei- 
tungen 104a, 104b, ... aus der Einrichtung 102 ausgegeben 
und einer Einrichtung 106 zum Bilden des codierten Signals 
25 ubermittelt, wobei die Einrichtung 106 zum Bilden des co- 
dierten Signals ausgebildet ist, urn die erste Teilskalie- 
rungsschicht (TSS) und die zweite Teilskalierungsschicht so 
in das codierte Signal an einem Ausgang 108 der in Fig. la 
gezeigten Vorrichtung aufzunehmen, dali die erste und die 
30 zweite Teilskalierungsschicht getrennt voneinander deco - 
dierbar sind. 

Die Einrichtung 102 zum Erzeugen der Teilskalierungsschich- 
ten arbeitet unter Verwendung von Bits bestimmter Ordnung 
35 einer ersten Anzahl der binaren Spektralwerte in einem 
Band, wobei die erste Anzahl grolJer oder gleich 1 ist und 
kleiner als eine Gesamtanzahl der binaren Spektralwerte in 
dem Band ist. Zum Erzeugen der zweiten Teilskalierungs - 
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schicht verwendet die Einrichtung 102 Bits der bestinunten 
Ordnung einer zweiten Anzahl der binaren Spektralwerte, wo - 
bei die zweite Anzahl der binaren Spektral werte so gewahlt 
wird, dali sie groBer Oder gleich 1 und kleiner als die Ge- 
5 samtanzahl der binaren Spektral werte in dem Band ist, und 
wobei die zweite Anzahl der binaren Spektral werte so be- 
stimmt wird, dalJ sie zumindest einen binaren Spektralwert 
aufweist, der in der ersten Anzahl von binaren Spektral wer- 
ten nicht enthalten ist. Dies bedeutet, dalb jede Teilska- 
10 lierungsschicht, wenn sie decodiert worden ist, da zu fuhrt, 
daib wenigstens ein Spektralwert des betrachteten Bandes im 
Decodierer mit einer hoheren Genauigkeit vorliegt, als wenn 
diese Teilskalierungsschicht nicht in Betracht gezogen wor- 
den ware. 



15 



20 



Fig. lb zeigt ein skaliertes codiertes Signal als schemati- 
sche Bitstromdarstellung. Der Bitstrom, der das skalierte 
codierte Signal darstellt, umfaJit zunachst Seiteninf orina - 
tionen 110, die derart gestaltet sein konnen, wie es durch 
den BSAC -Standard vorgegeben ist. Der Bitstrom umfafit dann 
eine erste Skalierungsschicht 111, eine zweite Skalierungs- 
schicht 112, eine dritte Skalierungsschicht 113, eine vier- 
te Skalierungsschicht 114, eine fiinfte Skalierungsschicht 
115, ... Lediglich beispielhaft ist bei dem in Fig. lb ge- 
25 zeigten skalierten/codierten Signal die dritte Skalierungs- 
schicht 113 in vier Teilskal ierungsschichten (T. -Sk. -S) un- 
terteilt, die mit 113a - 113d bezeichnet sind. Dariiber hin- 
aus ist die fiinfte Skalierungsschicht lediglich beispiel- 
haft ebenfalls in Teilskal ierungsschichten unterteilt, und 
zwar in die Teilskalierungsschichten 115a, 115b, 115c, ... 



30 



Die erste Skalierungsschicht 111 umfaBt beispielsweise die 
Bits hochster Ordnung - entweder absolut gesehen oder, wie 
es ausgefuhrt worden ist, relativ zur psychoakustischen 
35 Maskierungsschwelle - der Spektral werte des Spektrums des 
Audio - und/oder Videosignals. Die zweite Skalierungsschicht 
112 umfaBt ebenfalls als komplette Skalierungsschicht die 
Bits der Spektral werte mit einer urn 1 niedrigeren Ordnung. 
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Die dritte Skalierungsschicht umfaBt insgesamt gesehen die 
Bits einer urn 2 niedrigeren Ordnung der Spektral werte, je- 
doch nicht als eine komplette Skalierungsschicht, die nur 
komplett decodiert werden kann, sondern - zur feineren Ge- 
5 nauigkeitsskalierung - aufgeteilt in vier voneinander ge- 
trennt decodierbare Teilskal ierungsschicht en 113a, 113b, 
113c, 113d. Bei dem in Fig. lb dargestell ten Beispiel wird 
das gesamte Spektrum, also die Gesamtanzahl der Spektral - 
werte, in Bandern von je vier Spekt ral wert en aufgeteilt. 

10 Die erste Teilskal ierungsschicht 113a umfalit dann die Bits 
der urn 3 niedrigeren Ordnung von jeweils einem Spekt ral wert 
in einem der Bander. Die zweite Teilskal ierungsschicht um- 
falit analog die Bits derselben Ordnung, jedoch von anderen 
Spekt ral wert en in den einzelnen Bandern. Die dritte Teils- 

15 kal ierungsschicht 113c umfaBt wiederum die Bits derselben 
Ordnung, jedoch wieder von anderen Spekt ral wert en in einem 
Band. Dasselbe gilt fur die vierte Teilskal ierungsschicht. 
Wurden Bander gewahlt, die jeweils vier Spektral werte um- 
fassen, so hat jede Teilskal ierungsschicht ein Bit eines 

20 Spektral werts fur jedes Band. Dies bedeutet, daB jede 
Teilskal ierungsschicht bei dem in Fig. lb dargestellten 
Beispiel Informationen iiber ein Viertel der Anzahl von Bits 
aufweist, wie eine komplette Skalierungsschicht, wie z. B. 
die erste Skalierungsschicht 111 oder die zweite Skalie- 
25 rungsschicht 112. 

Im nachfolgenden wird anhand von Fig. 2 eine Aufteilung des 
Betragsspektrums in Bitschichten parallel zur Mithorschwel - 
le dargestellt. Die in Fig. 2 durch ihre Bitmuster darge- 

30 stellten Spektralwerte sind Spekt ral werte, wie sie bei - 
spielsweise durch die IntMDCT erhalten werden, auf die spa- 
ter eingegangen wird. Die in Fig. 2 anhand ihres Bitmusters 
dargestellten binaren Spektralwerte konnen jedoch auch die 
Ergebnisse eines beliebigen Zeitbereich- 

35 /Frequenzbereichumsetzungsalgorithmus, wie z. B. einer FFT, 
sein, und zwar dargestellt als binare Ganzzahlen prinzipi- 
ell beliebiger GroBe. Die in Fig. 2 dargestellten binaren 
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Spektralwerte sind somit noch nicht unter Verwendung psy- 
choakustischer Gesichtspunkte quantisiert worden. 

In Fig. 2 ist ferner die psychoakustische Mithorschwell e 
5 als durchgezogene kontinuierl iche Linie eingezeichnet, die 
mit 0 dB bezeichnet ist. Durch den Verlauf der Mithor- 
schwell e im Spektrum ergeben sich - parallel zur Mithor - 
schwelle - verlauf ende Bitschichten, wobei die Zugehorig- 
keit eines Bits zu einer Bitschicht die psychoakustische 

10 bzw. psychooptische Relevanz dieses Bits widerspiegelt. So 
ist aus Fig. 2 beispiel sweise zu ersehen, dali der mit „1" 
bezeichnete Spektralwert Bits aufweist, die zwei Bitschich- 
ten oberhalb der Mithorschwell e belegen. Dagegen ist der 
noch groliere Spektralwert 5 dadurch ausgezeichnet, dali er 

15 hoherwertige Bits aufweist, die drei Bitschichten oberhalb 
der Mithorschwell e belegen. Die Spektralwerte 2, 3 und 4 
dagegen umfassen lediglich Bits, die in einer Bitschicht 
unterhalb der Mithorschwell e liegen. 

20 Im Hinblick auf die psychoakustische Transparenz, also auf 
die Horbarkeit von Storungen aufgrund einer Quantisierung 
bzw. aufgrund eines „Weglassens" von niederwertigen Bits 
wird die Mithorschwell e als O^B -Linie bezeichnet. Die psy- 
choakustisch signifikanteste Bitschicht, und damit die er- 

25 ste Skalierungsschicht bei dem in Fig. 2 gezeigten Bei- 
spiel, ist die Bitschicht zwischen 12 dB und 18 dB. Hier 
liefert lediglich der Spektralwert mit der Nr. 5 einen Bei - 
trag. Die erste Skalierungsschicht 111 von Fig. lb wiirde 
daher bei dem in Fig. 2 gezeigten Beispiel lediglich Infor- 

30 mationen iiber den Spektralwert 5 umfassen. 

Die zweite Bitschicht zwischen 6 dB und 12 dB, also die 
zweite Skalierungsschicht 112 von Fig. 2, umfaBt lediglich 
informationen iiber Bits des ersten Spektral werts und des 
35 fiinften Spektral werts, jedoch keine Informationen uber die 
anderen Spektralwerte, da deren MSB in niedrigeren Bit- 
schichten liegen. 
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Die dritte Bitschicht 113 bei dem in Fig. 2 gezeigten Bei - 
spiel umfalJt die Bits zwischen der O^B-Linie und der +6 - 
dB-Linie in Fig. 2 und umfalit nunmehr Informationen iiber 
die sechste, die fiinfte und die erste Spekt rail inie, jedoch 
imitier noch keine Informationen iiber die anderen Spekt ral - 
werte. Wiirde nunmehr die dritte Skal ierungsschicht bei dem 
in Fig. 2 gezeigten Beispiel als eine komplette Skalie- 
rungsschicht verarbeitet werden, so wiirde die Genauigkeits - 
abstufung von der zweiten Skal ierungsschicht zur dritten 
Skal ierungsschicht sehr stark sein, dahingehend, dalJ eine 
Decodierung lediglich der ersten und der zweiten Skal ie- 
rungsschicht - ohne die dritte Skal ierungsschicht - zu 
starken horbaren Storungen fiihren wiirde. Dagegen wurde eine 
Beriicksichtigung der dritten Skal ierungsschicht zu nahezu 
15 keinen horbaren Storungen mehr fuhren. Eine Abstufung in 
diesem Grenzbereich wird erf indungsgemali dadurch erreicht, 
dais Teilskalierungsschichten der dritten Skal ierungsschicht 
gebildet werden, wobei bei der in Fig. 2 gezeigten Situati- 
on trotz einer Bandauf teilung beispielsweise in m = 5 le- 
20 diglich zwei Teilskalierungsschichten geniigen wiirden, wobei 
eine erste Teilskal ierungsschicht das Bit zweiter Ordnung 
des Spektralwerts Nr. 1 umfassen wiirde, wahrend eine zweite 
Teilskal ierungsschicht das Bit dritter Ordnung des Spek- 
tralwerts Nr. 5 umfassen wiirde, wobei diese Bits in den 
25 Teilskalierungsschichten fiir den Spektralwert Nr. 1 und den 
Spektralwert Nr. 5 dieselbe Ordnung relativ zu den nie- 
derstwertigen Bits der Maskierungsschwell e haben. 



30 



35 



Nachfolgend wird zur Verdeutl ichung dieses Sachverhalts auf 
Fig. 3 Bezug genommen. Fig. 3 zeigt eine detailliertere 
Darstellung der Situation in Fig. 2, wobei nun jedoch die 
Mithorschwelle nicht mehr, wie in Fig. 2 dargestellt, an- 
hand ihres tatsachl ichen Wertes eingetragen ist, sondern in 
Fig. 3 beziiglich ihres hochstwertigen Bits dargestellt ist. 

Erf indungsgemali wurde herausgef unden, dalb fiir eine psychoa- 
kustische Transparenz, um alle ungiinstigen Falle abzufan- 
gen, so viele Bits eines quantisierten Spektralwerts iiber- 
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tragen werden miissen, dal5 die Ordnung des zuletzt iibertra- 
genen Bits gleich der Ordnung des hochstwertigen Bits der 
Maskierungsschwelle, die diesem Spektralwert zugeordnet 
ist, entspricht. In anderen Worten ausgedriickt bedeutet 
dies, dal5 von einem Spektralwert - sofern sie existieren - 
alle Bits ubertragen werden miissen, die eine hohere Ordnung 
haben als das MSB der Maskierungsschwell e, die diesem Spek- 
tralwert zugeordnet ist, und daft ferner auch das Bit des 
Spektralwerts, das dieselbe Ordnung hat wie das MSB der 
Maskierungsschwell e, zu ubertragen ist. 

Die erfindungsgemaBe Genauigkeitsskal ierung ist besonders 
um die psychoakustische Maskierungsschwell e herum interes- 
sant, also fiir die Bits von Spektralwert en, die dieselbe 
Ordnung haben wie das MSB der Maskierungsschwell e, das die- 
sem Spektralwert zugeordnet ist. Diese Bits sind bei dem in 
Fig. 3 gezeigten Diagramm als fett umrandete Kastchen ein- 
gezeichnet. 

Allgemein gesagt ist in Fig. 3 in vertikaler Richtung die 
Bitordnung eingezeichnet, und zwar von MSB iiber MSB - 1, 
MSB - 2, MSB - 3, LSB + 2, LSB + 1 zu LSB eingezeichnet. 
Der Ausdruck „MSB^^ in Fig. 3 bezeichnet jedoch nicht das 
MSB eines bestimmten Spektralwerts oder einer psychoakusti - 
schen Maskierungsschwell e, sondern das absolute MSB, also 
die maximal darstellbare Zweierpotenz im binaren System. 

Dagegen ist in den in Fig. 3 dargestell ten dick umrandeten 
Kastchen das MSB der Mithorschwell e fiir einen Spektralwert 
1 bis 6 dargestell t. Insbesondere ist jedes Kastchen durch 
eine gestrichelte Diagonal e aufgeteilt, wobei oberhalb der 
Diagonal e ein Bit eines Spektralwerts steht, wahrend unter- 
halb der Diagonale ein Bit der Maskierungsschwell e fiir die- 
sen Spektralwert steht. Mit „1^^ bezeichnete Bits haben den 
Wert „1". Mit „0" bezeichnete Bits haben den Wert „0". 
SchlielSlich haben mit „x" gekennzeichnete Bits den Wert „0" 
Oder „1". Die erste Skalierungsschicht bzw. erste Bit- 
schicht bei dem in Fig, 3 gezeigten Beispiel umfalit somit 
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das Bit MSB des Spektralwerts 5, das Bit „MSB - 1" des 
Spektralwerts 4, das Bit „MSB - 2" des Spektralwerts 3, das 
Bit „MSB - 1" des Spektralwerts 2 und das Bit MSB des Spek- 
tralwerts 1. Die bestimmte Ordnung der Bits in der ersten 
5 Skalierungsschicht ist daher urn 3 hoher als die Ordnung des 
Bits, in dem das MSB der Maskierungsschwell e liegt. 

Die zweite Skalierungsschicht wiirde dann die Bits (MSB 
1), (MSB - 2), (MSB - 3), (MSB - 2) und (MSB - 1) fur die 

10 Spektralwerte 5, 4, 3, 2 und 1 umfassen. Die dritte Skalie- 
rungsschicht wiirde dann die Bits (MSB -2), (MSB - 3), (LSB 
+ 2), (MSB - 3) und (MSB - 2) wieder fur die Spektralwerte 
5, 4, 3, 2 und 1 umfassen. Die vierte Skalierungsschicht, 
deren Aufteilung in Teilskal ierungsschichten bevorzugt 

15 wird, wiirde dann die dick umrandeten Bits aus Fig. 3 umfas- 
sen, also (MSB - 3), (LSB + 2), (LSB + 1), (LSB + 2) und 
(MSB - 3) wieder fiir die Spektralwerte 5, 4, 3, 2 und 1 um- 
fassen. Eine 8bertragung der ersten, zweiten, dritten und 
vierten Skalierungsschicht fiihrt zu psychoakustischer Tran- 

20 sparenz, wahrend, wenn die vierte Skalierungsschicht wegge- 
lassen werden wiirde, eine GenauigkeitseinbuBe von 6 dB er- 
halten wird. 

ErfindungsgemaB wird daher die vierte Skalierungsschicht in 
25 z. B. fiinf Teilskalierungsschichten aufgeteilt, wobei in 
jeder Teilskalierungsschicht ein Spekt ralwertbit fur einen 
Spektralwert in dem fiinf Spektralwerte umfassenden Band 
vorgesehen sein wird. 

30 Jede Teilskalierungsschicht liefert somit eine Genauig- 
keitszunahme von 6 dB/(m =5) =1,2 dB. 

Damit bei dem in Fig. 3 dargestellten Aus fiihrungsbei spiel 
der Verlauf der Bitschichten im Decodierer nachvoll zogen 
35 werden kann, wird die Mithorschwell e bzw. der Verlauf der 
gerade noch psychoakustisch signif ikanten Bits, also der 
MSBs der Mithorschwell e, zum Decodierer beispielsweise in- 
nerhalb der Seiteninf ormationen 110 von Fig. lb iibertragen. 
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Hierfiir werden zwei Alternativen bevorzugt. Diese sind die 
linienweise Darstellung und die bandweise Darstellung. 

Bei einer linienweisen Darstellung laftt sich die Mithor- 
schwelle aufgrund ihres kontinuierl ichen Verlaufs effizient 
durch die Frequenzantwort eines FIR-Filters mit wenigen 
Koeff izienten oder durch polynominale Interpolation dar- 
stellen. Hierbei entsteht also fur j eden Frequenzwert ein 
eigener Wert der Mithorschwelle. 



Bei der bandweisen Darstellung wird darauf Bezug genommen, 
daB die psychoakustischen Verdeckungsef f ekte, die der Mit- 
horschwelle zugrunde liegen, bandweise ausgedriickt werden 
konnen, wo bei die Bandeinteilung der Bark-Skala folgen kann 

15 und vorzugsweise eine Verfeinerung der Bark-Skala dar- 
stellt. Diese bandweise Darstellung wird auch bei bekannten 
Verfahren zur gehorangepaBten Audio co die rung, wie z. B. 
MPEG -2 AAC, verwendet. Fiir die Darstellung der Mithor- 
schwelle reicht es somit aus, einen Wert pro Band zu iiber- 

20 tragen. 

Wie es bereits ausgefiihrt worden ist, stellen die Fig. 2 
und 3 die Definition von Bitschichten gleicher psychoaku- 
stischer Signifikanz beispielsweise im IntMDCT -Spekt rum 

25 dar. Die Bits werden, wie es ausgefuhrt worden ist, begin- 
nend mit der hochsten Schicht, Schicht fiir Schicht codiert 
und iibertragen. Beim Erreichen der Bitschicht, die der Mit- 
horschwelle entspricht (den in Fig. 3 fett umrandeten 
Bits), ist das ubertragene Signal psychoakustisch transpa- 

30 rent. Die Sbertragung weiterer Bitschichten, also von Bits 
unterhalb der in Fig. 3 dargestellten dick umrandeten Ha- 
sten, erhoht die Genauigkeit und damit den Sicherheitsab- 
stand zur Mithorschwelle. Werden schlielilich alle zur Ver- 
fiigung stehenden Bits iibertragen, so arbeitet das Verfahren 

35 verlustlos. Wie es ausgefiihrt worden ist, wird zur Redun- 
danzreduktion der iibertragenen Bits vorzugsweise eine 
arithmetische Codierung eingesetzt. 
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Die Verfeinerung der Genauigkeitsskal ierung aufgrund der 
erf indungsgemafl verwendeten Teilskal ierungsschichten, die 
im Decodierer getrennt voneinander verwertbar sind, ist 
insbesondere im Bereich oberhalb der Mit horschwell e, auf 
der Mithorschwelle und unterhalb der Mithorschwell e (bezo- 
gen auf die Ordnung des MSB der Mithorschwelle) von beson- 
derem Vorteil. Ohne Genauigkeitsskal ierung ergibt sich bei 
einer schichtweisen Sbertragung der Bits des IntMDCT- 
Spektrums eine Erhohung der Genauigkeit urn 6 dB. Beachtet 
inan jedoch^ dafi zumindest bei rauschartigen Signal en die 
Mithorschwelle nur etwa 6 dB unterhalb des Signals liegt, 
so sieht man, dafi eine Skal ierung der Genauigkeit in 6-dB- 
Schritten fur eine effiziente Codierung der gerade noch 
horbaren Signalanteile oftmals zu grob ist. 

Die im Vorstehenden beschriebene Aufteilung in 1, 5-dB- 
Schritte, wenn Bander mit vier Spektral werten verwendet 
werden, und in jeder Teilskalierungsschicht ein einziger 
Spektral wert angeordnet ist, oder wenn beispielsweise Ban- 
der mit acht Spektral werten verwendet werden und in jeder 
Teilskalierungsschicht zwei Spektral wert e beriicksichtigt 
werden, soil eine Entsprechung zur Anpassung der Genauig- 
keit in 1, 5-dB-Schritten sein, die auch bei MPEG-2 AAC vor- 
liegt. Hier erfolgt eine bandweise adaptive Quantisierung 
von kontinuierlichen Spektral werten mit Hilfe von Skalie- 
rungsfaktoren der Form 2°'^^"", wobei n ganzzahlige Werte an- 
nimmt. Wird n urn 1 erhoht, so andert sich bei MPEG-2 AAC 
die Genauigkeit der Quantisierung urn 1, 5 dB. 

Das erf indungsgemalie Konzept liefert diese Verfeinerung der 
Genauigkeitsskal ierung, indem die Bitschichten in Teilska- 
lierungsschichten unterteilt werden, wobei m Teilschichten 
einer Schicht erhalten werden, indem je m benachbarte Lini- 
en auf die m Teilschichten aufgeteilt werden. Mit jeder neu 
ubertragenen Teilschicht erhoht sich dann die Genauigkeit 
urn 6/m dB. Fur m = 4 ist also beispielsweise eine Abstufung 
in 1, 5-<lB-Schritten moglich. Im Gegensatz zur oben be- 
schriebenen Quantisierung beim Verfahren MPEG-2 AAC wird 



jedoch beim erf indungsgemaiien Konzept die Genauigkeit in 
jeder Teilschicht fiir nur eine von m Spektrall inien erhoht. 
Da die psychoakustischen Verdeckungsef f ekte im Frequenzbe- 
reich bandweise und nicht linienweise auftreten, erhalt man 
durch die Erhohung der Genauigkeit einer Spektrallinie den- 
selben Genauigkeitsgewinn pro Band wie bei der gleichmalii- 
gen Erhohung der Genauigkeit im ganzen Band. 

Nachfolgend wird anhand der Fig. 4 und 5 auf bevorzugte Ar- 
ten und Weisen zum Auswahlen eingegangen, welche der m 
Spektrall inien in der nachsten Teilschicht verfeinert wird. 

Fig. 4 zeigt einen Fall, bei dem die Mithorschwelle linien- 
weise dargestellt ist. Die Mithorschwelle ist als durchge- 
zogene Linie eingezeichnet. Dariiber ist durch ein „Kreuz" 
das MSB der Mithorschwelle eingezeichnet. Die Decodierung 
aller oberhalb liegenden in Fig. 4 nicht dargestellten Ska- 
lierungsschichten ist bereits abgeschlossen, so daJi die 
Spektralwerte 1, 2, 3 und 4 mit einer durch „0'' dargestell- 
ten Genauigkeit vorliegen. Das mit „0" dargestellte bisher 
iibertragene Bit stellt daher die Genauigkeit der Spektral- 
linie im Decodierer dar. Durch einen Vergleich des Werts 
des bisher verarbeiteten Spektral werts im Codierer mit dem 
Wert der Mithorschwelle fur diesen Spektral wert ergibt sich 
unmittelbar, welcher Spektralwert bisher am ungenauesten 
iibertragen worden ist. Bei dem in Fig. 4 gezeigten Beispiel 
ist dies, wie es aus Fig. 4 ohne weiteres ersichtlich ist, 
der Spektralwert 2. Die erste Teilskalierungsschicht wird 
daher das nachste Bit des Spektral werts Nr. 2 erhalten. 

Der nachste Spektralwert fiir die zweite Teilskalierungs- 
schicht ist der Spektralwert Nr. 4. Dann diirfte der Spek- 
tralwert Nr. 1 fiir die dritte Teilskalierungsschicht folgen 
und schlieBlich der Spektralwert Nr. 3 fiir die vierte 
Teilskalierungsschicht. 

Das nachste zu codierende Bit wird also der Frequenzl inie 
mit der groBten Differenz zwischen der Genauigkeit des bis- 
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her verarbeiteten Spektralwerts und der Mithorschwell e be- 
stimmt. 

Es sei darauf hingewiesen, dali dieser Vorgang im Decodierer 
umgekehrt werden kann, derart, dali der Decodierer in der 
Lage ist, ohne zusatzliche Seiteninf ormationen herauszufin- 
den, welcher Spektralwert durch die nachste zu decodierende 
Teilskalierungsschicht weiter verfeinert wird, solange der 
Decodierer den kontinuierl ichen Verlauf der ps ychoakusti - 
schen Maskierungsschwell e kennt. 

Fig. 5 zeigt den Fall der bandweisen Darstellung der Mit- 
horschwelle. Aus Fig. 5 ergibt sich, dali die Bits der Spek- 
tralwerte 2, 3, 4 als nachste zu verarbeitende Teilskalie- 
rungsschichten in Betracht kommen, da sie bisher im Ver- 
gleich zur Mithorschwell e am weitesten von derselben beab- 
standet sind. Dagegen liegt der Wert des Spektralwerts 1 
bereits nahe auf der Mithorschwell e, so dali der Spektral- 
wert 1 nicht unbedingt noch verfeinert werden muli, sehr 
wohl aber die Spektralwerte 2, 3 und 4. 

Prinzipiell konnte jeder der Spektralwerte 2, 3, 4 in der 
nachsten Teilskalierungsschicht beriicksichtigt werden. Ein 
Noise-Shaping ist jedoch dadurch erreichbar, dali der abso- 
lute Wert der Spektralwerte 2, 3 und 4, wie sie bereits im 
Codierer verarbeitet worden sind bzw. im Decodierer verar- 
beitet worden sind, beriicksichtigt wird. Stellt sich bei - 
spielsweise heraus, dali fur den Spektralwert Nr. 2 bereits 
z. B. sechs hoherwertigere Bits ubertragen worden sind, was 
darauf hinweist, daii der Spektralwert mit der Nr. 2 sehr 
groJi ist, so bedeutet dies, relativ gesehen, dali dieser 
Spektralwert bereits ziemlich genau dargestellt ist. Wird 
dagegen f estgestellt, dali der Spektralwert mit der Nr. 3 
ein kleiner Spektralwert ist, dahingehend, dafi lediglich z. 
B. nur ein einziges hoherwertiges Bit ubertragen worden 
ist, so wird, wie es erf indungsgemaB bevorzugt ist, zu- 
nachst den Spektralwert mit der Nr. 3 in einer Teilskalie- 
rungsschicht zu verarbeiten und dann erst den Spektralwert 
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Nr. 2. Diese Erkenntnis basiert darauf, dalJ davon ausgegan- 
gen wird, daI5 die relative Genauigkeit fiir den Horeindruck 
wesentlicher ist als die absolute Genauigkeit. 

5 Fig, 6 zeigt ein insgesamtes Blockschal tbild eines erfin- 
dungsgemalien Codierers. Das Zeitsignal wird an einem Ein- 
gang 600 in den Codierer eingespeist und z. B. mittels ei - 
ner IntMDCT 602 in den Frequenzbereich umgesetzt. Parallel 
hierzu arbeitet ein psychoakustisches Modell 84, das prin- 

10 zipiell dens el ben Aufbau ha ben kann wie das psychoakusti - 
schfe Modell 84, das in Fig. 8 dargestellt ist. Die Maskie- 
rungsschwelle, die durch das psychoakustische Modell 84 be- 
rechnet wird, wird nun jedoch nicht, wie in Fig. 8, zuin 
Quantisieren verwendet, sondern zum Definieren 604 von Ska- 

15 lierungsschichten. Insbesondere liefert bei einem bevorzug- 
ten Ausf iihrungsbeispiel der vorliegenden Erfindung die Ein- 
richtung 84 das MSB der Maskierungsschwell e entweder pro 
Spektralwert oder pro Band, urn gewissermaBen die in Fig. 3 
dargestellten „dick umrandeten^^ Kasten zu bestimmen. Die 

20 Einrichtung 604 definiert dann Skal ierungsschichten relativ 
zu der Ordnung der MSBs der Maskierungsschwell e (der dicken 
Kasten in Fig. 3) . 

Die Einrichtung 604 zum Definieren von Skal ierungsschichten 
25 steuert die Einrichtung 102 zum Erzeugen von Teilskalie- 
rungsschichten bzw, zum Erzeugen von Skal ierungsschichten, 
wenn sowohl Skal ierungsschichten als auch Teilskal ierungs - 
schichten eingesetzt werden soil en. Bei dem in Fig. 3 ge- 
zeigten Ausf iihrungsbeispiel wiirde die Einrichtung 102 der- 
30 art arbeiten, dafJ sie zunachst drei komplette Skalierungs- 
schichten erzeugt und einer Einrichtung 606 zur arithmeti- 
schen Codierung zufuhrt und dann fiir die vierte Skalie- 
rungsschicht, die die Bits der Spektral werte betrifft, de- 
ren Ordnung gleich der Ordnung der MSBs der Maskierungs- 
35 schwelle ist, in eine bestimmte Anzahl von Teilskal ierungs - 
schichten aufzuteilen. Nach der arithmetischen Codierung 
der Teilskal ierungsschichten werden die Skal ierungsschich- 
ten und die Teilskal ierungsschichten in einem Bitstrom 
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durch eine Bitstrombildungseinrichtung 608 erzeugt, urn ein 
skaliertes/codiertes Signal zu erhalten, das prinzipiell 
den in Fig. lb gezeigten Aufbau haben kann. 

Das skalierte/codierte Signal wird in einen Eingang 700 ei - 
nes in Fig. 7 gezeigten Decodierers eingespeist, wobei eine 
Ei-^richtung 702 den in Fig. lb gezeigten Bitstrom deforma- 
tieren wird^ urn die Seiteninf ormationen von den Skalie- 
rungsschichten zu trennen etc. Eine Extraktions- 
/Decodierungseinrichtung 704 fuhrt dann eine arithmetische 
Codierung der Skal ierungsschichten und der Teilskalierungs - 
schichten nacheinander durch, so dafi sich in einem decodie- 
rerseitigen, in Fig. 7 nicht gezeigten Speicher nach und 
nach die Bitmuster der einzelnen Spektral werte aufbauen. 

Je nach Anzahl der ubertragenen Skal ierungsschichten bzw. 
je nach Steuersignal an einem Steuereingang in der Einrich- 
tung 704 hort der Decodierer irgendwann damit auf, weitere 
Skal ierungsschichten oder Teil skal ierungsschichten zu deco - 
dieren. Wurden im Bitstrom samtliche codiererseitig erzeug- 
ten Skal ierungsschichten und Teilskalierungsschichten iiber- 
tragen und decodiert^ so hat eine verlustlose Codie- 
rung/8bertragung/Decodierung stattgef unden, und der Deco- 
dierer muii keine Interpretation von quantisierten Werten 
durchfiihren. Die erhaltenen Spektral werte nach verlustloser 
Oder nahezu verlustloser Codierung/ Sbertragung/Decodierung 
werden einer Riicktransf ormationseinrichtung 706 zugefiihrt, 
die beispielsweise eine inverse IntMDCT (IntMDCT"^) durch- 
fiihrt, urn an einem Ausgang 708 ein decodiertes Signal zu 
erhalten. Wurden beispielsweise aufgrund des 8bert ragungs - 
kanals bestimmte Skal ierungsschichten oder auch Teilskalie- 
rungsschichten abgeschnitten oder war der Decodierer auf- 
grund seines Aufbaus nicht in der Lage, alle Skal ierungs- 
schichten Oder Teilskalierungsschichten zu verarbeiten, 
Oder wurde die Einrichtung 704 derart gesteuert, urn nur ei- 
ne bestimmte Anzahl von Skal ierungsschichten bzw. Teilska- 
lierungsschichten zu verarbeiten, so fiihrt der erfindungs- 
gemafie Decodierer eine Interpretation der bisher vorliegen- 
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den Spektralwertebitmuster durch. Werden nicht alle Bit - 
schichten des Spektrums iibertragen, so liegen im Decodierer 
sorait fur jeden Spektralwert nur die hoherwertigen Bits 



vor. 



Unter Kenntnis der Mithorschwell e und der Zahl der insge- 
samt im Decodierer fiir den verlustlosen Fall erzeugten bzw. 
erzeugbaren Bitschichten ermittelt der Decodierer nunmehr, 
wie viele Bitschichten - und damit wie viele Bits - fiir je- 
den einzelnen Spektralwert nicht iibertragen worden sind. 
Aus diesen Daten konstruiert der Decodierer einen quanti- 
sierten Spektralwert. Die einfachste Losung hierfiir besteht 
darin, die nicht iibertragenen Bits durch Nullen zu ersetzen. 
In diesem Fall wiirde der Quantisierungspro zeli immer zu ei- 
ner Abrundung zu kleineren Absolutwerten fiihren. 

ErfindungsgemaB wird es jedoch bevorzugt, den mittleren 
Quant isierungsfehler so klein als moglich zu halten. Dies 
wird erreicht, indem ein sogenannter „Uniform Midrise Quan- 
tizer" verwendet wird, wie er in N. 8. Jayant, P. Noll: „Di- 
gital coding of waveforms". Prentice -Hall , 1 984, beschrie- 
ben ist. Dieser Quantisierer laBt das bei der Quantisierung 
verwendete Quantisierungsintervall unverandert, verschiebt 
aber den quantisierten Wert, also den Reprasentanten des 
Quantisierungsintervalls und damit die Interpretation der 
ubertragenen Bits urn einen gewissen Wert. Eine Verschiebung 
zur Mitte des Quantisierungsintervalls wird beispielsweise 
dann erreicht, wenn fiir die fehlenden Bits das Bitmuster „1 
0 0 0 ..." eingesetzt wird. Allgemein wird es bevorzugt, 
fiir die fehlenden niederwertigen Bits eines Spektral werts 
im Quantisierer zur Rekonstruktion Bitmuster einzusetzen, 
die sich von dem „Abrundungs bitmuster", das durch „0 0 0 
..." dargestellt ist, unterscheiden. In anderen Worten be- 
deutet dies, dali das Rekonstruktionsbitmuster zumindest ei- 
ne „1" umfaiit und vorzugsweise dali das hochstwertige Bit 
des Rekonstruktionsbitmusters eine „1" ist. 
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im nachfolgenden wird auf die Funktionsweise des in Fig. 6 
gezeigten Codierers und des in Fig. 7 gezeigten Decodierers 
eingegangen, die als bevorzugten Transf oritiationsalgorithmus 
die IntMDCT umfassen. Das IntMDCT -Spekt rum lief ert eine 
ganzzahlige spektrale Darstellung des Audiosignals. Paral- 
lel hierzu berechnet das psychoakustische Modell im in Fig. 
6 gezeigten Codierer die Mithorschwell e. Die Mithdrschwell e 
ist, wie es bereits ausgeftihrt worden ist, aufgrund des 
kontinuierlichen Verlaufs effizient codierbar und im 
Bitstrom iibertragbar, beispielsweise durch Koef f i zienten 
eines FIR-Filters oder durch polynominale Interpolation. 

Aus der Mithorschwelle ergibt sich fiir jede Spektrallinie 
die Anzahl der Bits, die psychoakustisch nicht signifikant 
sind, also die Bits der Spekt ralwerte, deren Ordnung gerin- 
ger ist als die Ordnung des MSB der Mithorschwelle fiir die- 
sen Spektralwert. Auf Fig. 3 bezogen sind dies die Bits un- 
terhalb den dick umrandeten Kasten. 

Jeder Betragswert der integer -Spektralwerte wird bitweise 
dargestellt, urn dann mittels der Einrichtung 604 entlang 
des Frequenzbereichs Bitschichten gleicher psychoakust i - 
scher Signifikanz, beispielsweise parallel zur Schicht der 
gerade noch psychoakustisch signifikant en Bits, zu definie- 
ren, wobei eine Praferenz niedriger Frequenzen in den si- 
gnifikanteren Schichten bevorzugt wird. Die Bits werden 
entlang der Signif ikanzschichten geordnet, wobei mit dem 
signifikantesten Bit begonnen wird. Die Startschicht ergibt 
sich entweder aus den theoretischen Maximal werten oder aus 
einer effizient codierten spektralen EinhixLl enden, analog 
zur codierten Mithorschwelle, oder aus einer Parall elver - 
schiebung der Mithorschwelle, wie z. B. um 30 dB, was also 
fiinf Bits entsprechen wiirde. 

in den Schichten hoher Signifikanz ist ein Auftreten von 
„1« sehr unwahrscheinlich, da nur wenige Spekt rail inien 
weit aus der Mithorschwelle herausragen, wie z. B. die 
spektrallinie 5 von Fig. 2 oder Fig. 3. 7u niedrigeren 
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Schichten hin steigt die Wahrscheinlichkeit fiir eine „1" an 
und nahert sich 50 %. Auf eine derart angeordnete Bitfolge 
wird es bevorzugt, die bitweise arithmetische Codierung zur 
Redundanzreduktion anzuwenden. 

Bei einem Aspekt der vorliegenden Erfindung wird der Ska- 
lierbarkeitsbereich nicht nur, wie in MPEG-4 BSAC, bis zur 
psychoakustischen Transparenz erweitert, sondern bis zur 
verlustlosen Codierung/Decodierung. Warden die gesamte co - 
dierte Bitfolge und bei entsprechender Darstellung auch die 
zugehorigen Vorzeichen der Spektral werte iibertragen, so ar- 
beitet das Ausf iihrungsbeispiel verlustlos. Wird nur ein 
Teil der codierten Bitfolge iibertragen, so ergibt sich be- 
reits eine irrel evanzreduktion. Wird die codierte Bitfolge 
jedoch bis zur Schicht der gerade noch signif ikanten Bits 
iibertragen, so arbeitet das Verfahren im gerade noch trans- 
parent em Modus. Werden weniger Bits iibertragen, so ergibt 
sich eine Reduktion der Bitrate, die jedoch auch mit einer 
Reduktion der Audio/Videoqualitat einhergeht. 

Werden zusatzlich zu den psychoakustisch signif ikanten 
Schichten weitere Schichten iibertragen, so wird das Audio - 
signal ( Videosignal) mit zusatzlichem Sicherheitsabstand 
zur Verdeckungsschwelle dargestellt und ermoglicht so eine 
nahezu verlustlose Darstellung mit einer groBen Robustheit 
gegeniiber Nachbearbeitungsschritten. 

Die Z^hl der notigen Bits zum Erreichen von Transparenz va - 
riiert von Block zu Block. Wird diese Information im voll - 
standigen, verlustlosen Bitstrom mitcodiert, so lalit sich 
diese Inforiration fiir die Steuerung der Bitzuteilung zum 
Erreichen einer konstanten Bitrate nutzen. Diese Informati- 
on liegt exakt vor und kann fiir jede gewunschte konstante 
Bitrate verwendet werden. So laJit sich aus dem vollstandi- 
gen, verlustlos codierten Bitstrom fiir jede vorgegebene 
konstante Bitrate ein gehorangepafit codierter Teil bitstrom 
entnehmen, der die Funktionalitat der lokal variierenden 
Bitrate nutzt. 
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SchlieBlich ermoglicht eine Sbertragung der zum Erreichen 
von Transparenz notigen Bitschichten in den Seiteninforma - 
tionen eine Kontrolle iiber die aktuelle im Teilbitstrom 
vibertragene Audioqualitat, indem dieser Wert mit der Zahl 
der tatsachlich ubertragenen Bitschichten verglichen wird. 

Im nachfolgenden wird als Beispiel fiir einen ganzzahligen 
Transformationsalgorithmus auf den IntMDCT- 

Transformationsalgorithmus eingegangen, der in „Audio Co- 
ding Based on Integer Transforms" 111-te AES -Versammlung, 
New York, 2001, beschrieben ist. Die IntMDCT ist besonders 
giinstig, da sie die attraktiven Eigenschaf ten der MDCT hat, 
wie z. B. eine gute spektrale Darstellung des Audiosignals, 
eine kritische Abtastung und eine Blockiiberlappung auf - 
weist. 

Fig. 11 zeigt ein Sbersichtsdiagramm fiir die erf indungsge- 
mafi bevorzugte Vorrichtung zum Verarbeiten von zeitdiskre- 
ten Abtastwerten, die ein Audiosignal darstellen, um ganz- 
zahlige Werte zu erhalten, auf denen aufbauend der Int- 
MDCT -Ganzzahl -Transformationsalgorithmus arbeitet. Die 
zeitdiskreten Abtastwerte werden durch die in Fig. 11 ge- 
zeigte Vorrichtung gefenstert und optional in eine spektra- 
le Darstellung umgesetzt. Die zeitdiskreten Abtastwerte, 
die an einem Eingang 10 in die Vorrichtung eingespeist wer- 
den, werden mit einem Fenster w mit einer Lange, die 2N 
zeitdiskreten Abtastwerten entspricht, gefenstert, um an 
einem Ausgang 12 ganzzahlige gefensterte Abtastwerte zu er- 
reichen, welche dazu geeignet sind, um mittels einer Trans- 
formation und insbesondere der Einrichtung 14 zum Ausf iihren 
einer ganzzahligen DCT in eine spektrale Darstellung umge- 
setzt zu werden. Die ganzzahlige DCT ist ausgebildet, um 
aus N Eingangswerten N Ausgangswerte zu erzeugen, was im 
Gegensatz zu der MDCT -Funkt ion 408 von Fig. 10a steht, die 
aus 2N gefensterten Abtastwerten aufgrund der MDCT- 
Gleichung lediglich N Spektral werte erzeugt. 
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Zum Fenstern der zeitdiskreten Abtastwerte werden zunachst 
in einer Einrichtung 16 zwei zeitdiskrete Abtastwerte aus - 
gewahlt, die zusammen einen Vektor von zeitdiskreten Ab- 
tastwerten darstellen. Ein zeitdiskreter Abtastwert, der 
5 durch die Einrichtung 16 ausgewahlt wird, liegt im ersten 
Viertel des Fensters. Der andere zeitdiskrete Abtastwert 
liegt in dem zweiten Viertel des Fensters, wie es anhand 
von Fig. 13 noch detaill ierter ausgefiihrt wird. Der durch 
die Einrichtung 16 erzeugte Vektor wird nunmehr mit einer 
10 Drehmatrix der Dimension 2x2 beauf schlagt, wobei diese 
Operation nicht unmittelbar durchgefiihrt wird, sondern mit- 
tels mehrerer sogenannten Lif tingH^Iatri zen. 

Eine Lifting Htotrix hat die Eigenschaft, dali sie nur ein 
15 Element aufweist, das von dem Fenster w abhangt und un- 
gleich "1" oder "0" ist. 

Die Faktorisierung von Wavelet -Trans format ionen in Lifting - 
Schritte ist in der Fachverof f entlichung "Factoring Wavelet 

20 Transforms Into Lifting Steps", Ingrid Daubechies und Wim 
Sweldens, Preprint, Bell Laboratories, Lucent Technologies, 
1996, dargestellt. Allgemein ist ein Lifting -Schema eine 
einfache Beziehung zwischen perfekt rekonstruierenden Fil - 
terpaaren, die dasselbe Tief paB - oder HochpaBf il ter haben. 

25 Jedes Paar kompl ementarer Filter kann in Lifting -Schritte 
faktorisiert werden. Insbesondere gilt dies fur Givens - 
Rotationen. Es sei der Fall betrachtet, bei dem die Poly- 
phasenmatrix eine Givens -Rotation ist. Es gilt dann: 



30 



(cos a 
sin a 



-sina^ 



cos a J 



sma 

1 



1 



v^sina 



1 



sma 



0 1 



(1) 



Jede der drei rechts des Gl eichheits zeichens stehenden Lif- 
ting -Matri zen hat als Hauptdiagonalelemente den Wert "1". 
Ferner ist in jeder Lifting ^latrix ein Nebendiagonal el ement 
35 gleich 0, und ein Nebendiagonal el ement vom Drehwinkel a 
abhangig. 
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Der Vektor wird nunmehr mit der dritten Lif ting rix, d, 
h. der Lif tingmatrix ganz rechts in obiger Gleichung, mul - 
tipliziert, urn einen ersten Ergebnis vektor zu erhalten. 
Dies ist in Fig. 11 durch eine Einrichtung 18 dargestellt. 
Es wird nunmehr der erste Ergebnisvektor mit einer beliebi- 
gen Rundungsf unktion, die die Menge der reellen Zahlen in 
die Menge der ganzen Zahlen abbildet, gerundet, wie es in 
Fig. 11 durch eine Einrichtung 20 dargestellt ist. Am Aus - 
gang der Einrichtung 20 wird ein gerundeter erster Ergeb- 
nisvektor erhalten. Der gerundet e erste Ergebnisvektor wird 
nunmehr in eine Einrichtung 22 zum Multipli zieren desselben 
mit der mittleren, d. h. zweiten, Lif ting -Matrix einge- 
speist, um einen zweiten Ergebnisvektor zu erhalten, der in 
einer Einrichtung 24 wiederum gerundet wird, urn einen ge- 
rundeten zweiten Ergebnisvektor zu erhalten. Der gerundete 
zweite Ergebnisvektor wird nunmehr in eine Einrichtung 26 
eingespeist, und zwar zum Multipli zieren desselben mit der 
links in der obigen Gleichung auf gef iihrten, d. h. ersten, 
Liftingmatrix, um einen dritten Ergebnisvektor zu erhalten, 
der schlieiilich noch mittels einer Einrichtung 28 gerundet 
wird, um schlieiilich an dem Ausgang 12 ganzzahlige gef en - 
sterte Abtastwerte zu erhalten, die nun, wenn eine spektra- 
le Darstellung derselben gewiinscht wird, durch die Einrich- 
tung 14 verarbeitet werden miissen, um an einem Spektralaus- 
gang 30 ganzzahlige Spektralwerte zu erhc. *:en. 

Vorzugsweise ist die Einrichtung 14 als Ganzzahl -OCT oder 
Integer -DCT ausgefiihrt. 

Die diskrete Cosinus -Transformation gemaB Typ 4 (DCT -IV) 
mit einer Lange N ist durch folgende Gleichung gegeben: 



Die Koeff izienten der DCT -IV bilden eine orthonormale N x N 
Matrix. Jede orthogonale N x N-Matrix kann in N (N-l)/2 Gi - 
vens -Rotationen zerlegt werden, wie es in der Fachverof - 




(2) 
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fentlichung P. P. Vaidyanathan, "Multirate Systems And Fil- 
ter Banks", Prentice Hall, Englewood Cliffs, 1 993, ausge- 
fiihrt ist. Es sei darauf hingewiesen, dali auch weitere Zer- 
legungen exist ieren. 

Bezuglich der Klassif ikationen der verschiedenen DCT - 
Algorithmen sei auf H. S. Malvar, "Signal Processing With 
Lapped Transforms", Artech House, 1 992, verwiesen. Allge- 
mein unt erscheiden sich die DCT -Algorithmen durch die Art 
ihrer Basisf unktionen. Wahrend die DCT -IV, die hier bevor- 
zugt wird, nicht -symmetrische Basisf unktionen umfafit, d. h. 
eine Cosinus -Viertelwelle, eine Cosinus -3/4 -Well e, eine Co - 
sinus -5/4 -Welle, eine Cosinus -7/4 -Well e, etc., hat die dis - 
krete Cosinustransf ormation z. B. vom Typ II (DCT -II), ach- 
sensymmetrische und punktsymmetrische Basisf unktionen. Die 
0-te Basisf unktion hat einen Gleichanteil , die erste Basis - 
funktion ist eine halbe Cosinuswelle, die zweite Basisf unk- 
tion ist eine ganze Cosinuswelle, usw. Aufgrund der Tatsa - 
che, dali die DCT -II den Gleichanteil besonders beriicksich- 
tigt, wird sie bei der Videocodierung verwendet, nicht aber 
bei der Audiocodierung, da bei der Audiocodierung im Gegen- 
satz zur Videocodierung der Gleichanteil nicht von Relevanz 
ist. 

Im nachfolgend wird darauf eingegangen, wie der Drehwinkel 
a der Givens -Rotation von der Fensterf unktion abhangt. 

Eine MDCT mit einer Fensterlange von 2N kann in eine dis - 
krete Cosinustransf ormation vom Typ IV mit einer Lange N 
reduziert werden. Dies wird da durch erreicht, dali die TDAC- 
Operation explizit im Zeitbereich durchgefuhrt wird, und 
dafi dann die DCT -IV angewandt wird. Bei einer 50%igen 8ber- 
lappung iiberlappt die linke Halfte des Fensters fiir einen 
Block t mit der rechten Halfte des vorausgehenden Blocks, 
d. h. des Blocks t-1. Der iiberlappende Teil zwei aufeinan- 
derfolgender Blocke t-1 und t wird im Zeitbereich, d. h. 
vor der Transformation, f olgendermalien vorverarbeitet, d. 
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20 



h. zwischen dem Eingang 10 und dem Ausgang 12 von Fig. 11 
verarbeitet: 



(3) 



Die mit der Tilde bezeichneten Werte sind die Werte am Aus- 
gang 12 von Fig. 11, wahrend die ohne Tilde in der obigen 
10 Gleichung bezeichnete x Werte die Werte am Eingang 10 bzw. 
hinter der Einrichtung 16 zum Auswahlen sind. Der Lauf index 
k lauft von 0 bis N/2-1, wahrend w die Fensterf unktion dar- 
stellt. 

15 Aus der TDAC-Bedingung fiir die Fensterf unktion w gilt f ol - 
gender 2ijsammenhang: 



\2 



= 1 (4) 



Fiir bestimmte Winkel a„ k = 0, N/2-1 kann diese Vor- 

verarbeitung im Zeitbereich als Givens -Rotation geschrieben 
werden, wie es ausgefiihrt worden ist. 

25 Der Winkel a der Givens -Rotation hangt folgendermaBen von 
der Fensterfunktion w ab: 

a = arctan[ w(N/2-l-k) / w(N/2 + k) ] (5) 

30 Es sei darauf hingewiesen, dalJ beliebige Fensterf unktionen 
w eingesetzt werden konnen, solange sie diese TDAC- 
Bedingung erfullen. 

im nachfolgenden wird anhand von Fig. 12 ein kaskadierter 
35 Codierer und Decodierer beschrieben. Die zeitdiskreten Ab- 



i 



- 39 - 



tastwerte x( 0) bis x(2N-l), die durch ein Fenster gemeinsam 
"gefenstert" werden, werden zunachst derart durch die Ein- 
richtung 16 von Fig. 11 ausgewahlt, daB der Abtastwert x( 0) 
und der Abtastwert x(N-l), d. h. ein Abtastwert aus dam er- 
5 sten Viertel des Fensters und ein Abtastwert aus dem zwei- 
ten Viertel des Fensters, ausgewahlt werden, um den Vektor 
am Ausgang der Einrichtung 16 zu bilden. Die sich iiberkreu- 
zenden Pfeile stellen schematisch die Lifting- 
Multiplikationen und anschlieBenden Rundungen der Einrich- 
10 tungen 18, 20 bzw. 22, 24 bzw. 26, 28 dar, um am Eingang 
der DCT-IV-Bl6cke die ganzzahligen gefensterten Abtastwerte 
zu erhalten. 



Wenn der erste Vektor wie oben beschrieben verarbeitet ist, 

15 wird ferner ein zweiter Vektor aus den Abtastwerten x(N/2- 
1) und x(N/2), d. h. wieder ein Abtastwert aus dem ersten 
Viertel des Fenster und ein Abtastwert aus dem zweiten 
Viertel des Fensters, ausgewahlt und wiederum durch den in 
Fig. 11 beschriebenen Algorithmus verarbeitet. Analog da zu 

20 werden samtliche anderen Abtastwertpaare aus dem ersten und 
zweiten Viertel des Fensters bearbeitet. Die selbe Verar- 
beitung wird fiir das dritte und vierte Viertel des ersten 
Fensters durchgef iihrt. Nunmehr liegen am Ausgang 12 2N ge- 
fensterte ganzzahlige Abtastwerte vor, die nunmehr so, wie 

25 es in Fig. 12 dargestellt ist, in eine DCT-IV- 
Transformation eingespeist werden. Insbesondere werden die 
ganzzahligen gefensterten Abtastwerte des zweiten und drit - 
ten Viertel s in eine DCT eingespeist. Die gefensterten 
ganzzahligen Abtastwerte des ersten Viertel s des Fensters 

30 werden in eine vorausgehende DCT -IV zusammen mit den gefen- 
sterten ganzzahligen Abtastwerten des vierten Viertels des 
vorausgehenden Fensters verarbeitet. Analog dazu wird das 
vierte Viertel der gefensterten ganzzahligen Abtastwerte in 
Fig. 12 mit dem ersten Viertel des nachsten Fensters zu- 
35 sammen in eine DCT -IV-Transformation eingespeist. Die mitt - 
lere in Fig. 12 gezeigte ganzzahlige DCT -IV-Transformation 
32 liefert nunmehr N ganzzahlige Spektral werte y( 0) bis 
y(N-l). Diese ganzzahligen Spektral werte konnen nunmehr 
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beispielsweise einfach Entropie^odiert werden, ohne daJi 
eine dazwischenliegende Quantisierung erforderlich ist, da 
die Fensterung und Transf oritation ganzzahlige Ausgangswert e 
lief ert. 

5 

In der rechten Halfte von Fig. 12 ist ein Decodierer darge- 
stellt. Der Decodierer bestehend aus Riicktrans format ion und 
"inverser Fensterung" arbeitet invers zum Codierer. Es ist 
bekannt, daJi zur Rticktrans format ion einer DCT -IV eine in- 

10 verse DCT -IV verwendet werden kann, wie es in Fig. 12 dar- 
gestellt ist. Die Ausgangswerte der Decodierer -DCT -IV 34 
werden nunmehr, wie es in Fig. 12 dargestellt ist, mit den 
entsprechenden Werten der vorausgehenden Transformation 
bzw. der nachfolgenden Transformation invers verarbeitet, 

15 urn aus den ganzzahligen gefensterten Abtastwerten am Aus- 
gang der Einrichtung 34 bzw. der vorausgehenden und nach- 
folgenden Transformation wieder zeitdiskrete Audio - 
Abtastwerte x( 0) bis x(2N-l) zu erzeugen. 

20 Die ausgangsseitige Operation geschieht durch eine inverse 
Givens -Rotation, d. h. derart, daft die Blocke 26, 28 bzw. 
22, 24 bzw. 18, 20 in der entgegengeset zten Richtung durch- 
laufen werden. Dies sei anhand der zweiten Lifting -Matrix 
von Gleichung 1 naher dargestellt. Wenn ( im Codierer) der 

25 zweite Ergebnisvektor durch Mul tipl ikation des gerundeten 
ersten Ergebnisvektors mit der zweiten Lif tingmatrix (Ein- 
richtung 22) gebildet wird, so ergibt sich folgender Aus - 
druck: 

30 {x,y)h^{x,y + xsma) (6) 

Die Werte x, y auf der rechten Seite von Gleichung 6 sind 
Ganzzahlen. Dies trifft jedoch fur den Wert x sin a nicht 
zu. Hier muB die Rundungsf unktion r eingefuhrt werden, wie 
35 es in der nachfolgenden Gleichung 



(x, y) H» (x, j; + r(xsin a)) ( 7 ) 
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dargestellt ist- Diese Operation fuhrt die Einrichtung 24 



20 



25 



aus. 



Die inverse Abbildung ( im Decodierer) ist f olgendermaJien 
5 definiert: 

(jc',/)h-> (x ,/~r(x'sina)) ( 8) 

Aufgrund dem Minus zeichens vor der Rundungsoperation wird 
10 ersichtlich, daB die ganzzahlige Appro ximierung des Lif- 
ting-Schritts umgekehrt werden kann, ohne daB ein Fehler 
eingefiihrt wird. Die Anwendung dieser Approximation auf je- 
den der drei Lifting -Schritte fuhrt zu einer ganzzahligen 
Approximation der Givens -Rotation. Die gerundete Rotation 
15 (im Codierer) kann umgekehrt werden ( im Decodierer), ohne 
dalJ ein Fehler eingefiihrt wird, und zwar indem die inversen 
gerundeten Lifting -Schritte in umgekehrter Reihenfolge 
durchlaufen werden, d. h. wenn beim Decodieren der Algo- 
rithmus von Fig. 11 von unten nach oben durchgef iihrt wird. 



Wenn die Rundungsf unktion r punktsymmetrisch ist, ist die 
inverse gerundete Rotation identisch zu der gerundeten Ro- 
tation mit dem Winkel -a und lautet f olgendermaBen: 



cosa sina^ 



^-sina cos ay 



( 9) 



Die Lif tingH^atrizen fur den Decodierer, d. h. fur die in- 
verse Givens -Rotation, ergibt sich in diesem Fall unmittel - 
bar aus Gleichung (1), indem lediglich der Ausdruck "sin 
30 a" durch den Ausdruck "-sin a" ersetzt wird. 

Im nachfolgenden wird anhand von Fig- 13 noch einmal die 
Zerlegung einer ublichen MDCT mit iiberlappenden Fenstern 40 
bis 46 dargelegt. Die Fenster 40 bis 46 uberlappen jeweils 
35 zu 50%. Pro Fenster werden zunachst Givens -Rotationen in- 
nerhalb des ersten und zweiten Viertels eines Fensters bzw. 
innerhalb des dritten und vierten Viertels eines Fensters 



ausgefiihrt, wie es durch die Pfeile 4 8 schematisch darge- 
stellt ist. Dann werden die rotierten Werte, d. h. die ge- 
fensterten ganzzahligen Abtastwerte derart in eine N-zu-N- 
DCT eingespeist, dali inuner das zweite und dritte Viertel 
eines Fensters bzw. das vierte und erste Viertel eines dar- 
auffolgenden Fensters gemeinsam mittels eines DCT-IV- 
Mgorithmus in eine spektrale Darstellung umgesetzt wird. 

Es werden daher die iiblichen Givens -Rotation in Lifting- 
Matrizen zerlegt, die sequentiell ausgefuhrt werden, wobei 
nach jeder Lif tingHtetrixHyiultiplikation ein Rundungs - 
schritt eingefuhrt wird, derart, dafi die Gl eitkomma -Z^hl en 
unmittelbar nach ihrer Entstehung gerundet werden, derart, 
dali vor jeder Multiplikation eines Ergebnisvektors mit ei- 
ner Lifting -Matrix der Ergebnisvektor lediglich Ganzzahlen 
hat. 

Die Ausgangswerte bleiben also iininer ganzzahlig, wobei es 
bevorzugt wird, auch ganzzahlige Eingangswerte zu verwen- 
den. Dies stellt keine Einschrankung dar, da jegliche bei - 
spielsweise PCM -Abtastwerte, wie sie auf einer CD abgespei- 
chert sind, ganzzahlige Zahlenwerte sind, deren Wertebe- 
reich je nach Bitbreite variiert, d. h. abhangig davon, ob 
die zeitdiskreten digital en Eingangswerte 16 -Bit -Werte oder 
24 -Bit -Werte sind. Dennoch ist, wie es ausgefuhrt worden 
ist, der gesamte ProzeB invertierbar, indem die inversen 
Rotationen in umgekehrter Reihenfolge ausgefuhrt werden. Es 
existiert somit eine ganzzahlige Approximation der MDCT mit 
perfekter Rekonstruktion, also eine verlustlose Transforma- 
tion. 

Die gezeigte Transformation liefert ganzzahlige Ausgangs- 
werte statt Gleitkommawerte. Sie liefert eine perfekte Re- 
konstruktion, so dali kein Fehler eingefuhrt wird, wenn eine 
Vorwarts- und dann eine Riickwartstransf ormation ausgefuhrt 
werden. Die Transformation ist gemafi einem bevorzugten Aus - 
f iihrungsbeispiel der vorliegenden Erfindung ein Ersatz fur 
die modifizierte diskrete Cosinustransf ormation. Auch ande- 
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re Transformationsverfahren konnen jedoch ganzzahlig ausge- 
fuhrt werden, so lange eine Zerlegung in Rotationen und ei - 
ne Zerlegung der Rotationen in Lifting -Schritte moglich 
ist. 

5 

Die ganzzahlige MDCT hat die meisten giinstigen Eigenschaf- 
ten der MDCT. Sie hat eine uberlappende Struktur, wodurch 
eine bessere Frequenzsel ektivitat als bei nicht - 
iiberlappenden Blocktransf ormationen erhalten wird. Aufgrund 
0 der TDAC-Funktion, die bereits beim Fenstern vor der Trans- 
formation beriicksichtigt wird, wird eine kritische Abta - 
stung beibehalten, so daB die Gesamtanzahl von Spektralwer- 
ten, die ein Audiosignal darstellen, gleich der Gesamtan- 
zahl von Eingangs -Abtastwerten ist. 

15 

Verglichen mit einer normal en MDCT, die Gleitkomma- 
Abtastwerte liefert, zeigt sich bei der beschriebenen be- 
vorzugten ganzzahligen Transformation, dafi lediglich in dem 
Spektralbereich, in dem wenig Signal peg el ist, das Rauschen 

20 im Vergleich zur normal en MDCT erhoht ist, wahrend sich 
diese Rauscherhohung bei signif ikanten Signalpegeln nicht 
bemerkbar macht. Dafiir bietet sich die ganzzahlige Verar- 
beitung fiir eine effiziente Hardware -I mpl ement at ion an, da 
lediglich Multiplikationsschritte verwendet werden, die oh- 

25 ne weiteres in Verschieben -Addieren -Schritte (Shift/Add- 
Schritte) zerlegt werden konnen, welche einfach und schnell 
hardwaremaiiig impl ementiert werden konnen. Sel bstverstand - 
lich ist auch eine Software-Implementation moglich. 

30 Die ganzzahlige Transformation liefert eine gute spektrale 
Darstellung des Audiosignals und bleibt dennoch im Bereich 
der ganzen TahLen. Wenn sie auf tonal e Telle eines Audiosi- 
gnals angewandt wird, resultiert dies in einer gut en Ener- 
giekonzentrierung. Damit kann ein effizientes verlustloses 

35 Codierschema aufgebaut werden, indem einfach die in Fig. 11 
dargestellte Fensterung/Transf ormation mit einem Entropie- 
codierer kaskadiert wird. Insbesondere ein gestapeltes Co - 
dieren (Stacked Coding) unter Verwendung von Escape -Werten, 
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wie es in MPEG AAC eingesetzt wird, ist gunstig. Es wird 
bevorzugt, alle Werte urn eine bestinunte Pot en z von zwei 
herunterzuskalieren, bis sie in eine erwiinschte Codetabelle 
passen, und dann die weggelassenen niederstwertigen Bits 
5 zusatzlich zu codieren. Im Vergleich zu der Alternative der 
Verwendung von grofieren Codetabellen ist die beschriebene 
Alternative hinsichtlich des Speicherverbrauchs zum Spei- 
chern der Codetabellen gunstiger. Ein nahezu verlustloser 
Codierer konnte auch dadurch erhalten warden, dafi einfach 
10 bestinunte der niederstwertigen Bits weggelassen warden. 

Insbesondera fiir tonale Signale ermoglicht eine Entropia- 
Codierung der ganzzahligen Spektral werte einen ho hen Co - 
diergawinn. Fur transienta Taile des Signals ist der Co- 
15 diergawinn niedrig, und zwar aufgrund des flachen Spektrums 
transient er Signale, d. h. aufgrund ainer geringen Anzahl 
von Spaktralwerten, die gleich oder nahezu 0 sind. Wie es 
in J. Herre, J. D. Johnston: "Enhancing the Performance of 
Perceptual Audio Coders by Using Temporal Noise Shaping 
20 (TNS)"^ 101. AES Convention, Los Angeles, 1996, Preprint 
4384, baschrieban ist, kann diase Flachheit jedoch verwen- 
det warden, indem eine lineare Pradiktion im Frequenzbe- 
reich varwendet wird. Eine Alternative ist eine Pradiktion 
mit offanar Schleife. Eine andere Alternative ist der Pra- 
25 diktor mit geschlossener Schleife. Die erste Alternative, 
d. h. der Pradiktor mit offener Schleife, wird TNS genannt. 
Die Quantisierung nach der Pradiktion fuhrt zu ainer Adap- 
tion des resultierenden Quantisierungsrauschens an die 
zeitliche Struktur des Audiosignals und verhindert dahar 
30 Vorechos in psychoakustischan Audiocodiararn. Fur ein ver- 
lustloses Audiocodiaran ist die zwaita Alternative, d. h- 
mit einam Pradiktor mit geschlossener Schleife, geeignatar, 
da die Pradiktion mit geschlossener Schleife eine ganaua 
Rekonstruktion das Eingangs signals arlaubt. Wenn diase 
35 Tachnik auf ein arzeugtas Spektrum angawandet wird, muB ein 
Rundungsschritt nach jedam Schritt das Pradiktionsf liters 
durchgafiihrt warden, urn im Baraich dar Ganzzahlen zu blai- 
ban. Durch Verwenden das inversen Filters und derselban 
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Rundungsfunktion kann das urspriingliche Spektrum genau wie- 
der hergestellt werden. 

Um die Redundanz zwischen zwei Kanalen zur Dat enreduktion 
5 auszunutzen, kann auch eine Mitte -Seit e -Codierung verlust- 
los eingesetzt werden, wenn eine gerundete Rotation mit ei - 
nem Winkel 7i/4 verwendet wird. Im Vergleich zur Alternative 
des Berechnens der Summe und Differenz des linken und rech- 
ten Kanals eines Stereosignals hat die gerundete Rotation 

10 den Vorteil der Energieerhal tung. Die Verwendung sogenann- 
ter Joint -Stereo -Codiertechniken kann fiir jedes Band ein- 
oder ausgeschaltet werden, wie es auch im Standard MPEG AAC 
durchgefiihrt wird. Weitere Drehwinkel konnen ebenfalls be- 
riicksichtigt werden, um eine Redundanz zwischen zwei Kana- 

15 len flexibler reduzieren zu konnen. 

Je nach den praktischen Gegebenheiten kann das erfindungs- 
gemaJie Codierkonzept bzw. das erf indungsgemaBe Decodierkon- 
zept in Hardware oder in Software implementiert werden. Die 

20 Implementierung kann auf einem digital en Speichermedium, 
insbesondere einer Diskette oder CD mit elektronisch aus - 
lesbaren Steuersignalen erfolgen, die so mit einem program- 
mierbaren Computersystem zusammenwirken konnen, dali das 
entsprechende Verfahren ausgefiihrt wird. Allgemein besteht 

25 die Erfindung somit auch in einem Computerprogrammprodukt 
mit einem auf einem maschinenl esbaren Trager gespeicherten 
Programmcode zur Durchfiihrung des erf indungsgemaBen Codier- 
verfahrens oder des erf indungsgemalien Decodierverf ahrens, 
wenn das Computerprogrammprodukt auf einem Rechner ablauft. 

30 In anderen Worten ausgedruckt stellt die Erfindung somit 
ein Computerprogramm mit einem Programmcode zur Durchf iihren 
des Verf ahrens zum Decodieren bzw. zum Durchf iihren des Ver- 
fahrens zum Codieren dar, wenn das Computerprogramm auf ei- 
nem Computer ablauft. 



Vorrichtung zum skalierbaren Codieren eines Spektrums 
eines Signals, das Audio- und/oder Videoinf ormationen 
umfalit, wobei das Spektrum binare Spektral wert e auf - 
weist, mit folgenden Merkmalen: 

einer Einrichtung (102) zum Erzeugen einer ersten 
Teilskalierungsschicht unter Verwendung von Bits be- 
stimmter Ordnung einer ersten Anzahl der binaren Spek- 
tralwerte in einem Band, wobei die erste Anzahl groBer 
Oder gleich 1 ist und kl einer als eine Gesamtanzahl 
der binaren Spektral wert e in dem Band ist, und zum Er- 
zeugen einer zweiten Teilskalierungsschicht unter Ver- 
wendung von Bits der bestimmten Ordnung einer zweiten 
Anzahl der binaren Spektral wert e, wobei die Einrich- 
tung (102) zum Erzeugen ausgebildet ist, urn die zweite 
Anzahl der binaren Spektral werte so zu wahlen, dafi sie 
groBer oder gleich 1 und kleiner als die Gesamtanzahl 
der binaren Spektral werte in dem Band ist, und urn die 
zweite Anzahl der Spektral werte ferner so zu bestim- 
men, daB sie zumindest einen binaren Spektral wert auf - 
weist, der in der ersten Anzahl von binaren Spektral- 
werten nicht enthalten ist; und 

einer Einrichtung (106) zum Bilden eines codierten Si- 
gnals, wobei die Einrichtung zum Bilden ausgebildet 
ist, um die erste Teilskalierungsschicht und die zwei- 
te Teilskalierungsschicht so in das codierte Signal 
aufzunehmen, daB die erste und die zweite Teilskalie- 
rungsschicht (113a, 113b) getrennt voneinander deco- 
dierbar sind. 

Vorrichtung gemaB Anspruch 1, die ferner folgende 
Merkmale aufweist: 

eine Einrichtung zum Erzeugen einer Vollskal ierungs - 
schicht unter Verwendung von alien Bits mit einer Ord- 



nung, die sich von der bestimmten Ordnung unterschei- 
detr in dem Band, und 

wobei die Einrichtung zum Bilden (106) ferner ausge- 
bildet ist, urn die Vollskalierungsschicht so in dem 
Bitstrom aufzunehmen, dafi sie unabhangig von der er- 
sten und der zweiten Teilskalierungsschicht (113a, 
113b) decodierbar ist. 

Vorrichtung gemaB Anspruch 1 oder 2, bei der die bina- 
ren Spektralwerte quantisiert sind, wobei die Vorrich- 
tung ferner folgende Merkmale aufweist: 

eine Einrichtung (84) zum Berechnen von Ordnungen von 
hochstwertigen Bits einer psychoakustischen Maskie- 
rungsschwelle fiir die Bander; und 

eine Einrichtung (604) zum Definieren von Skalierungs- 
schichten der Bits der binaren Spektral werte, wobei 
eine Skalierungsschicht Bits der binaren Spektral werte 
aufweist, deren Ordnungen in einem bestimmten Abstand 
zu den Ordnungen der hochstwertigen Bits der psychoa- 
kustischen Maskierungsschwelle fiir die Bander liegen 
Oder deren Ordnungen gleich den Ordnungen der hochst- 
wertigen Bits der psychoakustischen Maskierungsschwel- 
le fiir diese Bander sind. 

Vorrichtung gemaB Anspruch 3, 

bei der die Einrichtung (102) zum Erzeugen der ersten 
und der zweiten Teilskalierungsschicht (113a, 113b) 
ausgebildet ist, urn als Bits bestimmter Ordnung die 
Bits der binaren Spektral werte zu verwenden, deren Ab- 
stand zu der Ordnung des hochstwertigen Bits der psy- 
choakustischen Maskierungsschwelle in dem Band gleich 
„+l^\ „0^^ und/oder „-l'' ist- 

Vorrichtung gemaB Anspruch 3 oder 4, 



bei der die Einrichtung (84) zum Berechnen der Ordnun- 
gen von hochstwertigen Bits der ps ychoakustischen Mas - 
kierungsschwelle ausgebildet ist, urn fur j eden Spek- 
tralwert in dem Band eine Ordnung eines hochstwertigen 
Bits zu bestimmen, oder urn eine Ordnung eines hochst- 
wertigen Bits der ps ychoakustischen Maskierungsschwel - 
le fiir das gesamte Band zu bestimmen. 

Vorrichtung gemali einem der Anspriiche 3 bis 5^ bei der 
die Einrichtung (106) zum Bilden ferner ausgebildet 
ist, um Inf ormationen iiber die psychoakustische Mas - 
kierungsschwelle als Seiteninf ormationen (110) in das 
codierte Signal auf zunehmen. 

Vorrichtung gemafi einem der vorhergehenden Anspriiche, 

bei der die erste Teilskalierungsschicht vor der zwei - 
ten Teilskalierungsschicht decodierbar ist, und 

bei der die Einrichtung (102) zum Erzeugen der ersten 
und der zweiten Teilskalierungsschicht ausgebildet 
ist, um fiir die erste Anzahl der binaren Spektral wert e 
den/die Spektral werte auszuwahlen, durch den/die ein 
groBter Genauigkeitsgewinn fiir das Band erzielbar ist. 

Vorrichtung gemafi einem der Anspriiche 1 bis 7, 

bei der die erste Teilskalierungsschicht vor der zwei- 
ten Teilskalierungsschicht decodierbar ist, und 

bei der die Einrichtung (102) zum Erzeugen der ersten 
und der zweiten Teilskalierungsschicht ausgebildet 
ist, um fiir die erste Teilskalierungsschicht den bina- 
ren Spektralwert zu verwenden, der, dargestellt durch 
Bits in hoheren Skalierungsschichten, in dem Band die 
grolite Differenz zu einer ps ychoakustischen Maskie- 
rungsschwelle fiir den Spektralwert aufweist. 



Vorrichtung gemaB einem der vorhergehenden Anspriiche, 

bei der die Einrichtung (102) zum Erzeugen der ersten 
und der zweiten Teilskalierungsschicht ausgebildet 
ist, um fiir die erste Teilskalierungsschicht den bina- 
ren Spektralwert zu verwenden, der, dargestellt durch 
Bits in hoheren Skal ierungsschichten, in dem Band der 
kleinste quantisierte Spektralwert ist. 

Vorrichtung gemali einem der vorhergehenden Anspruche, 

bei der die Spektral werte durch eine GanzzahHyiDCT aus 
zeitlichen Abtastwerten des Signals erzeugt worden 
sind. 

Vorrichtung gemali Anspruch 1 oder 2, bei der die Spek- 
tral werte unter Verwendung eines psychoakustischen 
bzw. psychooptischen Modells quantisiert sind (82). 

Vorrichtung gemali Anspruch 11, 

bei der die Einrichtung (102) zum Erzeugen einer er- 
sten und einer zweiten Teilskalierungsschicht ausge- 
bildet ist, um eine konstante bestimmte Ordnung von 
Bits in den Bandern zu verwenden. 

Vorrichtung gemali Anspruch 11 oder 12, 

bei der die bestimmte Ordnung die niederstwertige Ord- 
nung der Bits der quantisierten binaren Spektral werte 
ist. 

Vorrichtung gemali einem der vorhergehenden Anspruche, 
bei der ein Band m Spektral werte aufweist. 



wobei m grolier oder gleich 2 ist, und 
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bei der die Einrichtung (102) zum Erzeugen der ersten 
und der zweiten Teilskalierungsschicht ausgebildet 
ist, um die erste und die zweite Anzahl von Teilska- 
5 1 ierungsschichten so zu berechnen, dafi> sie hochstens 

gleich m sind und mindestens gleich 1 sind, wobei in 
dem Fall, in dem m Teilskal ierungsschichten vorhanden 
sind, jede Teilskalierungsschicht ein Bit der bestimm- 
ten Ordnung von genau einem Spektralwert umfalit, wobei 
10 ein Spektralwert nur in genau einer Teilskalierungs- 

schicht fiir die bestimmte Ordnung vorhanden ist. 

15. Vorrichtung gemali Anspruch 14, bei der m gleich 4 ist. 

15 16. Vorrichtung gemaJi einem der vorhergehenden Anspriiche, 

bei der die Einrichtung (102) zum Erzeugen der ersten 
und der zweiten Teilskalierungsschicht ausgebildet 
ist, um eine arithmetische Codierung der ersten bzw. 
20 zweiten Anzahl von Bits der quantisierten Spektralwer- 

te der bestimmten Ordnung durchzuf uhren. 

17. Vorrichtung zum skalierbaren Decodieren eines codier- 
ten Signals, das eine erste und eine zweite Teilska- 

25 lierungsschicht aufweist, wobei die erste Teilskalie- 

rungsschicht Bits bestimmter Ordnung einer ersten An- 
zahl von binaren Spektralwert en in einem Band auf- 
weist, wobei die zweite Teilskalierungsschicht Bits 
der bestimmten Ordnung einer zweiten Anzahl von bina- 

30 ren Spektralwerte in dem Band aufweist, und wobei die 

zweite Anzahl zumindest einen Spektralwert aufweist, 
der in der ersten Anzahl nicht enthalten ist, mit f ol - 
genden Merkmalen: 

35 einer Einrichtung (704) zum Extrahieren der ersten 

Teilskalierungsschicht aus dem codierten Signal und 
der zweiten Teilskalierungsschicht aus dem codierten 
Signal; und 
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einer Einrichtung zum Verarbeiten der ersten Teilska- 
lierungsschicht und der zweiten Teilskal ierungs - 
schicht, urn die Bits der bestimmten Ordnung der bina- 
ren quantisierten Spektral werte in dem Band zu ermit - 
tel n. 

Vorrichtung gemafi Anspruch 11, 

bei der die erste Anzahl der binaren Spektral werte fur 
die erste Teilskalierungsschicht gewahlt ist, urn einen 
groBten Genauigkeitsgewinn fiir ein Band zu erzielen, 

wobei die Einrichtung (704) zum Extrahieren ausgebil - 
det ist, urn die erste Teilskalierungsschicht vor der 
zweiten Teilskalierungsschicht zu extrahieren. 

Verfahren zum skalierbaren Codieren eines Spektrums 
eines Signals, das Audio- und/oder Videoinf ormationen 
umfalJt, wobei das Spektrum binare Spektral werte auf - 
weist, mit folgenden Schritten: 

Erzeugen (102) einer ersten Teilskalierungsschicht un- 
ter Verwendung von Bits bestimmter Ordnung einer er- 
sten Anzahl der binaren Spektral werte in einem Band, 
wobei die erste Anzahl groBer oder gleich 1 ist und 
kleiner als eine Gesamtanzahl der binaren Spektralwer- 
te in dem Band ist, und zum Erzeugen einer zweiten 
Teilskalierungsschicht unter Verwendung von Bits der 
bestimmten Ordnung einer zweiten Anzahl der binaren 
Spektral werte, wobei die Einrichtung (102) zum Erzeu- 
gen ausgebildet ist, um die zweite Anzahl der binaren 
Spektral werte so zu wahlen, daB sie groBer oder gleich 
1 und kleiner als die Gesamtanzahl der binaren Spek- 
tralwerte in dem Band ist, und um die zweite Anzahl 
der Spektral werte ferner so zu bestimmen, daB sie zu- 
mindest einen binaren Spektralwert aufweist, der in 
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der ersten Anzahl von binaren Spekt ral werten nicht 
enthalten ist; und 

Bilden (106) eines codierten Signals^ wobei die Ein- 
richtung zum Bilden ausgebildet ist, um die erste 
Teilskalierungsschicht und die zweite Teilskal ierungs - 
schicht so in das codierte Signal auf zunehmen, dali die 
erste und die zweite Teilskalierungsschicht (113a, 
113b) getrennt voneinander decodierbar sind. 

Verfahren zum skalierbaren Decodieren eines codierten 
Signals, das eine erste und eine zweite Teilskalie- 
rungsschicht aufweist/ wobei die erste Teilskalie- 
rungsschicht Bits bestimmter Ordnung einer ersten An- 
zahl von binaren Spekt ral werten in einem Band auf- 
weist, wobei die zweite Teilskalierungsschicht Bits 
der bestimmten Ordnung einer zweiten Anzahl von bina- 
ren Spekt ral werte in dem Band aufweist, und wobei die 
zweite Anzahl zumindest einen Spekt ral wert aufweist, 
der in der ersten Anzahl nicht enthalten ist, mit f ol - 
genden Schritten: 

Extrahieren (704) der ersten Teilskalierungsschicht 
aus dem codierten Signal und der zweiten Teilskalie- 
rungsschicht aus dem codierten Signal; und 

Verarbeiten der ersten Teilskalierungsschicht und der 
zweiten Teilskalierungsschicht, um die Bits der be- 
stimmten Ordnung der binaren quant isiert en Spektral - 
werte in dem Band zu ermitteln. 

Computerprogramm mit einem Programmcode zur Durchfiih- 
rung des Verfahrens gemaB Anspruch 1 9 Oder Anspruch 
20, wenn das Programm auf einem Computer ablauft. 
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Vorrichtung und Verfahren zum skalierbaren Codieren und 
Vorrichtung und Verfahren zum skalierbare Decodieren 

Zusammenf assung 

Eine Vorrichtung zum skalierbaren Codieren eines Spektrums 
eines Signals, das Audio- und/oder Videoinf ormationen um- 
faftt, wobei das Spektrum binare Spektral wert e aufweist, um- 
falJt eine Einrichtung (102) zum Erzeugen einer ersten 
Teilskalierungsschicht und einer zweiten Teilskalierungs - 
schicht sowie eine Einrichtung (106) zum Bilden des codier- 
ten Signals, wobei die Einrichtung (106) zum Bilden ausge- 
bildet ist, um die erste Teilskalierungsschicht und die 
zweite Teilskalierungsschicht so in das codierte Signal 
aufzunehmen, dalJ die erste und die zweite Teilskalierungs- 
schicht getrennt voneinander decodierbar sind. Eine Teils- 
kalierungsschicht umfaBt im Gegensatz zu einer Vollskalie- 
rungsschicht nur die Bits bestimmter Ordnung eines Teils 
der binaren Spektral wert e in dem Band, so daB durch zusatz- 
liche Decodierung einer Teilskalierungsschicht ein feiner 
steuerbarer und feiner skalierbarer Genauigkeitsgewinn er- 
zielbar ist. 



1 



y\00 



AOl 




3- 



_j 



AA^C 'f'tr**. 



'■' . 1: hOchstos Bit mit Wart 1 (pro Spektfallfnie) 

. 'X ^ \ ': -lOodarl 

" / '' , \ ' V +6dB 

♦ . V. ,y. . V \^ OdB(Mltharschwalle) 

-V X/..:.-. .6dB 

12 dB 

^\ ^ 3 r t Fraquenz 

\ A 





0 ^ 

/ 0 






0 ' 












/ ^ 


O 

0 




^ ^ 0 


r 

. ' D 
















r 






r < 


0/ 


O y 

/ ^ 






' o 












X ^ 

M 














^ ' X 


' V 

; — 5- 
























^ [ 

1 3 




r 


6 





6c« 



001 



1 



Aol 



r — ' 1 


£ 

















I 




) 



n 

J 



1 



1 




a 





I 



1 



3^ 



2 



3^ 



i 



?3 



^5 9 



zeitdiskr. 
O 



AW 



402 



Fenstem mit 
Fensterlange 2N 



2N 



gefenst. 
AW 



50% 
Overlap 



406 



404 



z 



Fenstem 
Lange 2N 



2N 



gefenst. 
AW 



408 



z 



MDCT 



410 



z 



MDCT 



N Spektralwerte 
(1 . Fenster) 





N Spektralwerte 

(2. Fenster) 
KD 





412 

/ 


N SW 


-1 


2N AW1. 






o ► 


MDCT 




1 . Fenster 







N SW 

O 



1 . Fenster 



414 



z 



MDCT 



416 



z 



TDAC 



Y, (N+k) + Y2(k) 



N AW 

— O 



2N AW 



2. Fenster 



FIG.'fOb 



10 

zeitdiskr. 



Abtastweite 



16 

L 



Auswahlen 



18 



Vektor 



Ergebnis- 20 
vektor X 



Muitipl. 
mit 3. LM 



Runden 



gerundeter 
LEV 




24 



22-^ 



Muitipl. 
mit 2. LM 


2. EV 


Runden 


► 



26 



28 



14 



Integer - DCT 
Rotationen + 
Lifting 



gerundeter 
_^2.EV 



Muitipl. 
mitl.LM 


3. EV 


Runden 





ganzzahlige 
gefensterte 
Abtastwerte 



12 



30 



ganzzahlige 
Spektral- 
werte 



FIG. 11 




r~r t tt i rnr 



O 



I CM 



\ t t t t t I t 





FIG. ^3 



